Die substring()-Funktion in R: Ein umfassender Leitfaden

Die substring()-Funktion in R wird häufig verwendet, um entweder die in den Daten vorhandenen Zeichen zu extrahieren oder die Daten zu manipulieren. Sie können leicht die erforderlichen Zeichen aus einem String extrahieren und auch die Werte in einem String ersetzen.

Begrüßung und Einführung

Hallo Leute, ich hoffe, es geht euch gut. Heute konzentrieren wir uns auf die substring()-Funktion in R.

Die Syntax der substring()-Funktion

Substring: Wir können mehrere Dinge wie das Extrahieren von Werten, das Ersetzen von Werten und mehr durchführen. Dafür verwenden wir Funktionen wie substr() und substring().

substr(x,start,stop)
substring(x,erster,letzter=1000000L)

Wo:

  • x = die Eingabedaten / Datei.
  • Start / Erster= Startindex des Substrings.
  • Stopp / Letzter= Endindex des Substrings.

Extrahieren von Zeichen durch die substring()-Funktion in R

Nun, ich hoffe, dass Ihnen die Syntax jetzt ziemlich klar ist. Jetzt extrahieren wir einige Zeichen aus dem String mit unserer Substring()-Funktion in R.

       #gibt die Zeichen von 1 bis 11 zurück
        df<-("Journal_dev_private_limited")
        substring(df,1,11)
        Ausgabe = „Journal_dev“

        #gibt die Zeichen von 1 bis 7 zurück
        df<-("Journal_dev")
        substring(df,1,7)
        Ausgabe = „Journal“


Herzlichen Glückwunsch, Sie haben die Daten aus dem gegebenen String extrahiert. Wie Sie sehen können, nimmt die Substring()-Funktion in R die Start-/Erst- und End-/Letztwerte als Argumente und indiziert den String und gibt einen erforderlichen Substring der genannten Dimensionen zurück.

Ersetzen durch die substring()-Funktion in R

Mit Hilfe der substring()-Funktion können Sie auch die Werte im String mit Ihren gewünschten Werten ersetzen. Klingt interessant, oder? Dann sehen wir uns an, wie es funktioniert.

        #gibt den String zurück, indem das _ durch ein Leerzeichen ersetzt wird
        df<-("We are_developers")
        substring(df,7,7)=" "
        df
        Ausgabe = „We are developers“

        #Zeichenkettenersetzung
        df<-("R=is a language made for statistical analysis")
        substring(df,2,2)=" "
        df
        Ausgabe = „R is a language made for statistical analysis“


Großartig, das haben Sie geschafft! Auf diese Weise können Sie die Werte in einem String mit Ihrem gewünschten Wert ersetzen.

Im obigen Fall haben Sie das ‚_‘ (Unterstrich) und „=“ (Gleichheitszeichen) durch ein “ “ (Leerzeichen) ersetzt. Ich hoffe, das ist jetzt klarer.

Zeichenkettenersetzung durch die substring()-Funktion in R

Bis jetzt ist alles gut! Aber was ist, wenn Sie einige Werte ersetzen müssen, die in allen vorhandenen Strings widergespiegelt werden sollen?

Keine Sorge! Wir können die Werte ersetzen und sie in allen vorhandenen Strings widergespiegelt machen.

Sehen wir uns an, wie es funktioniert!

        #ersetzt den 4. Buchstaben jedes Strings durch $
        df<-c("Alok","Joseph","Hayato","Kelly","Paloma","Moca")
        substring(df,4,4)<-c("$")
        df
        Ausgabe = „Alo$“ „Jos$ph“ „Hay$to“ „Kel$y“ „Pal$ma“ „Moc$“


Oh, was ist passiert? Jeder 4. Buchstabe in den Strings wurde durch das ‚$‘-Zeichen ersetzt!

Nun, das ist die Substring()-Funktion für Sie. Sie kann die markierten Positionen mit unserem gegebenen Wert ersetzen.

Im obigen Fall wurde jeder 4. Buchstabe in allen Eingabestrings durch das ‚$‘-Zeichen mit der Substring()-Funktion ersetzt. Es ist unglaublich, nicht wahr? Ich sage Ja. Und Sie?

Die Verwendung der substr()- und str_sub()-Funktion in R

Wir haben uns bereits auf Zeilen konzentriert. Jetzt werden wir uns die Extraktion von Zeichen in den Spalten ansehen.

Sehen wir uns an, wie es funktioniert!

Wir können einen Datenrahmen mit Beispieldaten erstellen, der 2 Spalten enthält, nämlich Technologien und Popularität. Lassen Sie uns einige spezifische Zeichen aus diesen Daten extrahieren. Das wird Spaß machen.

        #erstellt den Datenrahmen
        df<-data.frame(Technologies=c("Datascience","machinelearning","Deeplearning","Artificalintelligence"),Popularity=c("70%","85%","90%","95%"))
        df
                   Technologies      Popularität
        1           Datascience        70%
        2       machinelearning        85%
        3          Deeplearning        90%
        4 Artificalintelligence        95%


Ja, wir haben jetzt einen Datenrahmen erstellt. Lassen Sie uns etwas Text extrahieren. Führen Sie dazu den folgenden Code aus, um Zeichen von 8 bis 10 in allen Strings in der Spalte Technologien mit der substr()-Funktion in R zu extrahieren.

        #erstellt eine neue Spalte mit extrahierten Werten
        df$Extracted_Technologies=substr(df$Technologies,8,10)
        df
        Ausgabe =

                     Technologies       Popularität     Extracted_Technologies
        1           Datascience_DS        70%                    enc
        2       machinelearning_ML        85%                    lea
        3          Deeplearning_DL        90%                    rni
        4 Artificalintelligence_AI        95%                    ali


Jetzt können Sie sehen, dass wir eine neue Spalte mit extrahierten Daten erstellt haben. So können Sie die Daten extrahieren, indem Sie die Indexwerte angeben.

Die Verwendung der str_sub()-Funktion in R

Wir haben die substr()-Funktion in Aktion gesehen. Jetzt, wie ich zuvor erwähnt habe, werden wir uns die str_sub()-Funktion und ihre Art der Extraktion ansehen.

Lasst uns loslegen!

Noch einmal werden wir denselben Datenrahmen erstellen, einschließlich der Daten von Technologien und deren Beliebtheit.

       df<-data.frame(Technologies=c("Datascience","machinelearning","Deeplearning","Artificalintelligence"),Popularity=c("70%","85%","90%","95%"))
        df
                   Technologies      Popularity
        1           Datascience        70%
        2       machinelearning        85%
        3          Deeplearning        90%
        4 Artificalintelligence        95%


Gut, lasst uns die str_sub()-Funktion verwenden, die die indizierten Zeichen als Ausgabe zurückgibt. Das Erstellen/Generieren eines Teilstrings in R kann auf viele Arten erfolgen und dies ist eine davon.

      #Verwendung der str_sub-Funktion
        df$Extracted_Technologies=str_sub(df$Technologies,10,15)
        > df
        Wie Sie sehen können, hat die str_sub()-Funktion die indizierten Werte extrahiert und gibt die Ausgabe wie unten gezeigt zurück.

                   Technologies   Popularity    Extracted_Technologies
        1           Datascience        70%                     ce
        2       machinelearning        85%                 arning
        3          Deeplearning        90%                    ing
        4 Artificalintelligence        95%                 intell

Zusammenfassung

Ja, das Erstellen oder Generieren eines Teilstrings des gegebenen Strings ist eine recht einfache Aufgabe. Dank Funktionen wie substr(), substring() und str_sub(), die das Erstellen von Teilstrings interessant und spannend gemacht haben.

Das ist alles für als umfassender Leitfaden. Vergessen Sie nicht, diese erstaunliche Funktion in Ihrer Berechnung zu verwenden. Fröhliches Teilstringen!!!

Kostenlosen Account erstellen

Registrieren Sie sich jetzt und erhalten Sie Zugang zu unseren Cloud Produkten.

Das könnte Sie auch interessieren:

centron Managed Cloud Hosting in Deutschland

Wie berechnet man den BLEU-Score in Python?

Python
Wie berechnet man den BLEU-Score in Python? Der BLEU-Score in Python ist eine Metrik, die die Güte von maschinellen Übersetzungsmodellen misst. Ursprünglich wurde er nur für Übersetzungsmodelle entwickelt, wird jedoch…