Das Verbinden oder Zusammenführen von Zeilen mit der rbind()-Funktion in R
rbind() steht für Zeilenbindung. Einfach ausgedrückt, das Verbinden von mehreren Zeilen, um einen einzelnen Stapel zu bilden. Dies kann das Verbinden von zwei Datenrahmen, Vektoren und mehr umfassen.
Über die rbind()-Funktion in der R-Programmierung
Dieser Artikel wird über die Verwendung und Anwendungen der rbind()-Funktion in der R-Programmierung sprechen.
Ohne viel Zeit zu verschwenden, lasst uns in das Thema einsteigen!!!
Syntax der rbind()-Funktion in R
rbind(): Die rbind- oder Zeilenbindungs-Funktion wird verwendet, um mehrere Gruppen von Zeilen zusammenzubinden.
rbind(x,x1)
Wo:
X = die Eingabedaten.
X1 = Die zu bindenden Daten.
Die Idee des Bindens von Zeilen mit der rbind()-Funktion in R
Die Idee, die Zeilen mehrerer Datenrahmen zu binden oder zu kombinieren, ist sehr nützlich bei der Datenmanipulation.
Das untenstehende Diagramm wird Ihnen definitiv die Arbeitsweise der rbind()-Funktion verdeutlichen.
Rbind in R
Sie können sehen, wie Zeilen verschiedener Datenrahmen durch die rbind()-Funktion verbunden/kombiniert werden.
Implementierung der rbind()-Funktion in R
Wie Sie wissen, wird die rbind()-Funktion in R verwendet, um die Zeilen verschiedener Datengruppen zu binden.
In diesem Abschnitt versuchen wir, einfache Datenrahmen zu konstruieren und sie mit der rbind()-Funktion zu binden.
#Erstellen eines Datenrahmens
Student_details<-c("Mark","John","Fredrick","Floyd","George")
Student_class<-c("Oberschule","Hochschule","Oberschule","Oberschule","Hochschule")
df1<-data.frame(Student_class,Student_details)
df1
Der obige Code wird einen einfachen Datenrahmen erstellen, der Studentendetails und Namen präsentiert.
Student_class Student_details
1 Oberschule Mark
2 Hochschule John
3 Oberschule Fredrick
4 Oberschule Floyd
5 Hochschule George
Gut, jetzt haben wir einen Datenrahmen mit 5 Zeilen. Lassen Sie uns einen weiteren Datenrahmen erstellen.
#Erstellen eines Datenrahmens
Student_details<-c("Bracy","Evin")
Student_class<-c("Oberschule","Hochschule")
Student_rank<-c("A","A+")
df2<-data.frame(Student_class,Student_details,Student_rank)
df2
Gut, jetzt haben wir 2 Datenrahmen unterschiedlicher Zeilenanzahl (df1 und df2). Lassen Sie uns die rbind()-Funktion verwenden, um die oben genannten 2 Datenrahmen in einen einzigen Datenrahmen zu binden.
Lassen Sie uns sehen, wie es funktioniert.
Sie werden nicht glauben, dass der gesamte Bindungsprozess nur eine Zeile Code erfordert.
#bindet Zeilen von 2 Eingabedatenrahmen
rbind(df1,df2)
Der resultierende Datenrahmen wird eine gebundene Version beider Datenrahmen sein, wie im obigen Ausgabe gezeigt.
Verbinden von zwei Datenrahmen unterschiedlicher Länge mit der bind()-Funktion
Nun, im vorherigen Abschnitt haben wir die beiden Zeilengruppen zusammengefügt.
In diesem Abschnitt werden wir zwei Datensätze zusammenführen, indem wir die rbind-Funktion in R verwenden.
#erstellt den Datenrahmen
Student_details<-c("Mark","John","Fredrick","Floyd","George")
Student_class<-c("Oberschule","Hochschule","Oberschule","Oberschule","Hochschule")
df1<-data.frame(Student_class,Student_details)
df1
Student_class Student_details
1 Oberschule Mark
2 Hochschule John
3 Oberschule Fredrick
4 Oberschule Floyd
5 Hochschule George
#erstellt den Datenrahmen
Student_details<-c("Bracy","Evin")
Student_class<-c("Oberschule","Hochschule")
Student_rank<-c("A","A+")
df2<-data.frame(Student_class,Student_details,Student_rank)
df2
Student_class Student_details Student_rank
1 Oberschule Bracy A
2 Hochschule Evin A+
rbind(df1,df2)
Error in rbind(deparse.level, ...) :
Anzahl der Spalten der Argumente stimmt nicht überein
Oh warte, was ist passiert? Warum gibt die Funktion einen Fehler aus?
Wenn Sie die Zeilen im Fehler lesen, wird angegeben, dass die Anzahl der Spalten nicht übereinstimmt.
Wir haben 2 Spalten in ‚df1‘ und 3 Spalten in ‚df2‘.
Keine Sorge! Wir haben die bind_rows()-Funktion, die uns in diesen Szenarien unterstützen wird.
Die bind_rows()-Funktion zum Verbinden ungleicher Datensätze
bind_rows() ist eine Funktion, die Teil des dplyr-Pakets ist. Wir müssen zuerst das dplyr-Paket importieren, um diese Funktion ausführen zu können.
Wir verwenden die gleichen Datenrahmen, die im obigen Abschnitt vorgestellt wurden, also df1 und df2. Lassen Sie uns sehen, wie es funktioniert.
#installiert benötigte Pakete
install.packages('dplyr')
#importiert Bibliotheken
library(dplyr)
#bindet die Zeilen
bind_rows(df1,df2)
Student_class Student_details Student_rank
1 Oberschule Mark <NA>
2 Hochschule John <NA>
3 Oberschule Fredrick <NA>
4 Oberschule Floyd <NA>
5 Hochschule George <NA>
6 Oberschule Bracy A
7 Hochschule Evin A+
Sie können jetzt sehen, dass die bind_rows-Funktion diese beiden ungleichen Datensätze in Bezug auf die Spaltenanzahl kombiniert hat. Die leeren Stellen werden als <NA> markiert.
Verbinden zweier Datensätze mit der rbind()-Funktion in R
In diesem Abschnitt werden wir uns mit dem Verbinden von zwei vollständigen Datensätzen in R befassen.
Lassen Sie uns sehen, wie es funktioniert.
Wir werden den BOD-Datensatz verwenden, da er nur 6 Zeilen hat und Sie auch die gebundenen Zeilen leicht beobachten können.
#bindet zwei Datensätze
rbind(BOD,BOD)
Zeit Bedarf
1 1 8.3
2 2 10.3
3 3 19.0
4 4 16.0
5 5 15.6
6 7 19.8
---------------
7 1 8.3
8 2 10.3
9 3 19.0
10 4 16.0
11 5 15.6
12 7 19.8
Der BOD-Datensatz hat 6 Zeilen. Da wir die Daten zweimal übergeben, wird die rbind()-Funktion die gleichen Zeilen binden, wie oben gezeigt.
Und vergessen Sie nicht, dass Sie auch die bind_rows()-Funktion haben.
#bindet zwei unterschiedliche Datensätze
bind_rows(BOD,women)
Zeit Bedarf Größe Gewicht
1 1 8.3 NA NA
2 2 10.3 NA NA
3 3 19.0 NA NA
4 4 16.0 NA NA
5 5 15.6 NA NA
6 7 19.8 NA NA
7 NA NA 58 115
8 NA NA 59 117
9 NA NA 60 120
10 NA NA 61 123
11 NA NA 62 126
12 NA NA 63 129
13 NA NA 64 132
14 NA NA 65 135
15 NA NA 66 139
16 NA NA 67 142
17 NA NA 68 146
18 NA NA 69 150
19 NA NA 70 154
20 NA NA 71 159
21 NA NA 72 164
Diese Beispiele zeigen deutlich die Arbeitsweise und Anwendungen der bind()- und bind_rows-Funktionen.
Ich hoffe, diese Illustrationen haben Ihnen geholfen, diese Funktionen zu verstehen.
Verbinden mehrerer Zeilengruppen in R
In diesem Abschnitt werden wir uns auf das Verbinden mehrerer (mehr als zwei) Zeilengruppen mit der Funktion rbind() konzentrieren. Lassen Sie uns sehen, wie es funktioniert.
#bindet Zeilen von 3 Datensätzen
bind_rows(BOD,women,ToothGrowth)
Zeit Bedarf Größe Gewicht Länge Ergänzung Dosis
1 1 8.3 NA NA NA <NA> NA
2 2 10.3 NA NA NA <NA> NA
3 3 19.0 NA NA NA <NA> NA
4 4 16.0 NA NA NA <NA> NA
5 5 15.6 NA NA NA <NA> NA
6 7 19.8 NA NA NA <NA> NA
7 NA NA 58 115 NA <NA> NA
8 NA NA 59 117 NA <NA> NA
9 NA NA 60 120 NA <NA> NA
10 NA NA 61 123 NA <NA> NA
11 NA NA 62 126 NA <NA> NA
12 NA NA 63 129 NA <NA> NA
13 NA NA 64 132 NA <NA> NA
14 NA NA 65 135 NA <NA> NA
15 NA NA 66 139 NA <NA> NA
16 NA NA 67 142 NA <NA> NA
17 NA NA 68 146 NA <NA> NA
18 NA NA 69 150 NA <NA> NA
19 NA NA 70 154 NA <NA> NA
20 NA NA 71 159 NA <NA> NA
Beobachten Sie, wie alle drei Datensätze durch die bind_rows()-Funktion in R verbunden oder kombiniert wurden. Das ist die Schönheit der bind_rows()-Funktion.
Diese beiden Funktionen haben endlose Anwendungen bei der Datenmanipulation in der R-Programmierung.
Zusammenfassung
Die rbind()-Funktion in R und die bind_rows()-Funktion sind die nützlichsten Funktionen, wenn es um Datenmanipulation geht.
Sie können problemlos zwei Datenrahmen mit gleicher Spaltenanzahl mit der rbind()-Funktion in R verbinden.
Zusammenfassung
Die rbind()-Funktion in R und die bind_rows()-Funktion sind die nützlichsten Funktionen, wenn es um Datenmanipulation geht.
Sie können problemlos zwei Datenrahmen mit gleicher Spaltenanzahl mit der rbind()-Funktion in R verbinden.
Ebenso können Sie, wenn die Datenrahmen ungleiche Spaltenanzahlen haben, die bind_rows()-Funktion zusammen mit dem dplyr-Paket verwenden.
Nun, das war’s vorerst, frohes Verbinden!!!