Die substring()-Funktion in R: Ein umfassender Leitfaden
Die substring()-Funktion in R wird häufig verwendet, um entweder die in den Daten vorhandenen Zeichen zu extrahieren oder die Daten zu manipulieren. Sie können leicht die erforderlichen Zeichen aus einem String extrahieren und auch die Werte in einem String ersetzen.
Begrüßung und Einführung
Hallo Leute, ich hoffe, es geht euch gut. Heute konzentrieren wir uns auf die substring()-Funktion in R.
Die Syntax der substring()-Funktion
Substring: Wir können mehrere Dinge wie das Extrahieren von Werten, das Ersetzen von Werten und mehr durchführen. Dafür verwenden wir Funktionen wie substr() und substring().
substr(x,start,stop)
substring(x,erster,letzter=1000000L)
Wo:
- x = die Eingabedaten / Datei.
- Start / Erster= Startindex des Substrings.
- Stopp / Letzter= Endindex des Substrings.
Extrahieren von Zeichen durch die substring()-Funktion in R
Nun, ich hoffe, dass Ihnen die Syntax jetzt ziemlich klar ist. Jetzt extrahieren wir einige Zeichen aus dem String mit unserer Substring()-Funktion in R.
#gibt die Zeichen von 1 bis 11 zurück
df<-("Journal_dev_private_limited")
substring(df,1,11)
Ausgabe = „Journal_dev“
#gibt die Zeichen von 1 bis 7 zurück
df<-("Journal_dev")
substring(df,1,7)
Ausgabe = „Journal“
Herzlichen Glückwunsch, Sie haben die Daten aus dem gegebenen String extrahiert. Wie Sie sehen können, nimmt die Substring()-Funktion in R die Start-/Erst- und End-/Letztwerte als Argumente und indiziert den String und gibt einen erforderlichen Substring der genannten Dimensionen zurück.
Ersetzen durch die substring()-Funktion in R
Mit Hilfe der substring()-Funktion können Sie auch die Werte im String mit Ihren gewünschten Werten ersetzen. Klingt interessant, oder? Dann sehen wir uns an, wie es funktioniert.
#gibt den String zurück, indem das _ durch ein Leerzeichen ersetzt wird
df<-("We are_developers")
substring(df,7,7)=" "
df
Ausgabe = „We are developers“
#Zeichenkettenersetzung
df<-("R=is a language made for statistical analysis")
substring(df,2,2)=" "
df
Ausgabe = „R is a language made for statistical analysis“
Großartig, das haben Sie geschafft! Auf diese Weise können Sie die Werte in einem String mit Ihrem gewünschten Wert ersetzen.
Im obigen Fall haben Sie das ‚_‘ (Unterstrich) und „=“ (Gleichheitszeichen) durch ein “ “ (Leerzeichen) ersetzt. Ich hoffe, das ist jetzt klarer.
Zeichenkettenersetzung durch die substring()-Funktion in R
Bis jetzt ist alles gut! Aber was ist, wenn Sie einige Werte ersetzen müssen, die in allen vorhandenen Strings widergespiegelt werden sollen?
Keine Sorge! Wir können die Werte ersetzen und sie in allen vorhandenen Strings widergespiegelt machen.
Sehen wir uns an, wie es funktioniert!
#ersetzt den 4. Buchstaben jedes Strings durch $
df<-c("Alok","Joseph","Hayato","Kelly","Paloma","Moca")
substring(df,4,4)<-c("$")
df
Ausgabe = „Alo$“ „Jos$ph“ „Hay$to“ „Kel$y“ „Pal$ma“ „Moc$“
Oh, was ist passiert? Jeder 4. Buchstabe in den Strings wurde durch das ‚$‘-Zeichen ersetzt!
Nun, das ist die Substring()-Funktion für Sie. Sie kann die markierten Positionen mit unserem gegebenen Wert ersetzen.
Im obigen Fall wurde jeder 4. Buchstabe in allen Eingabestrings durch das ‚$‘-Zeichen mit der Substring()-Funktion ersetzt. Es ist unglaublich, nicht wahr? Ich sage Ja. Und Sie?
Die Verwendung der substr()- und str_sub()-Funktion in R
Wir haben uns bereits auf Zeilen konzentriert. Jetzt werden wir uns die Extraktion von Zeichen in den Spalten ansehen.
Sehen wir uns an, wie es funktioniert!
Wir können einen Datenrahmen mit Beispieldaten erstellen, der 2 Spalten enthält, nämlich Technologien und Popularität. Lassen Sie uns einige spezifische Zeichen aus diesen Daten extrahieren. Das wird Spaß machen.
#erstellt den Datenrahmen
df<-data.frame(Technologies=c("Datascience","machinelearning","Deeplearning","Artificalintelligence"),Popularity=c("70%","85%","90%","95%"))
df
Technologies Popularität
1 Datascience 70%
2 machinelearning 85%
3 Deeplearning 90%
4 Artificalintelligence 95%
Ja, wir haben jetzt einen Datenrahmen erstellt. Lassen Sie uns etwas Text extrahieren. Führen Sie dazu den folgenden Code aus, um Zeichen von 8 bis 10 in allen Strings in der Spalte Technologien mit der substr()-Funktion in R zu extrahieren.
#erstellt eine neue Spalte mit extrahierten Werten
df$Extracted_Technologies=substr(df$Technologies,8,10)
df
Ausgabe =
Technologies Popularität Extracted_Technologies
1 Datascience_DS 70% enc
2 machinelearning_ML 85% lea
3 Deeplearning_DL 90% rni
4 Artificalintelligence_AI 95% ali
Jetzt können Sie sehen, dass wir eine neue Spalte mit extrahierten Daten erstellt haben. So können Sie die Daten extrahieren, indem Sie die Indexwerte angeben.
Die Verwendung der str_sub()-Funktion in R
Wir haben die substr()-Funktion in Aktion gesehen. Jetzt, wie ich zuvor erwähnt habe, werden wir uns die str_sub()-Funktion und ihre Art der Extraktion ansehen.
Lasst uns loslegen!
Noch einmal werden wir denselben Datenrahmen erstellen, einschließlich der Daten von Technologien und deren Beliebtheit.
df<-data.frame(Technologies=c("Datascience","machinelearning","Deeplearning","Artificalintelligence"),Popularity=c("70%","85%","90%","95%"))
df
Technologies Popularity
1 Datascience 70%
2 machinelearning 85%
3 Deeplearning 90%
4 Artificalintelligence 95%
Gut, lasst uns die str_sub()-Funktion verwenden, die die indizierten Zeichen als Ausgabe zurückgibt. Das Erstellen/Generieren eines Teilstrings in R kann auf viele Arten erfolgen und dies ist eine davon.
#Verwendung der str_sub-Funktion
df$Extracted_Technologies=str_sub(df$Technologies,10,15)
> df
Wie Sie sehen können, hat die str_sub()-Funktion die indizierten Werte extrahiert und gibt die Ausgabe wie unten gezeigt zurück.
Technologies Popularity Extracted_Technologies
1 Datascience 70% ce
2 machinelearning 85% arning
3 Deeplearning 90% ing
4 Artificalintelligence 95% intell
Zusammenfassung
Ja, das Erstellen oder Generieren eines Teilstrings des gegebenen Strings ist eine recht einfache Aufgabe. Dank Funktionen wie substr(), substring() und str_sub(), die das Erstellen von Teilstrings interessant und spannend gemacht haben.
Das ist alles für als umfassender Leitfaden. Vergessen Sie nicht, diese erstaunliche Funktion in Ihrer Berechnung zu verwenden. Fröhliches Teilstringen!!!