Das Verbinden oder Zusammenführen von Zeilen mit der rbind()-Funktion in R

rbind() steht für Zeilenbindung. Einfach ausgedrückt, das Verbinden von mehreren Zeilen, um einen einzelnen Stapel zu bilden. Dies kann das Verbinden von zwei Datenrahmen, Vektoren und mehr umfassen.

Über die rbind()-Funktion in der R-Programmierung

Dieser Artikel wird über die Verwendung und Anwendungen der rbind()-Funktion in der R-Programmierung sprechen.

Ohne viel Zeit zu verschwenden, lasst uns in das Thema einsteigen!!!

Syntax der rbind()-Funktion in R

rbind(): Die rbind- oder Zeilenbindungs-Funktion wird verwendet, um mehrere Gruppen von Zeilen zusammenzubinden.

rbind(x,x1)
Wo:

X = die Eingabedaten.
X1 = Die zu bindenden Daten.

Die Idee des Bindens von Zeilen mit der rbind()-Funktion in R

Die Idee, die Zeilen mehrerer Datenrahmen zu binden oder zu kombinieren, ist sehr nützlich bei der Datenmanipulation.

Das untenstehende Diagramm wird Ihnen definitiv die Arbeitsweise der rbind()-Funktion verdeutlichen.

Rbind in R

Sie können sehen, wie Zeilen verschiedener Datenrahmen durch die rbind()-Funktion verbunden/kombiniert werden.

Implementierung der rbind()-Funktion in R

Wie Sie wissen, wird die rbind()-Funktion in R verwendet, um die Zeilen verschiedener Datengruppen zu binden.

In diesem Abschnitt versuchen wir, einfache Datenrahmen zu konstruieren und sie mit der rbind()-Funktion zu binden.

#Erstellen eines Datenrahmens

Student_details<-c("Mark","John","Fredrick","Floyd","George")
Student_class<-c("Oberschule","Hochschule","Oberschule","Oberschule","Hochschule")
df1<-data.frame(Student_class,Student_details)

df1

Der obige Code wird einen einfachen Datenrahmen erstellen, der Studentendetails und Namen präsentiert.

   Student_class    Student_details
1   Oberschule            Mark
2       Hochschule            John
3   Oberschule        Fredrick
4   Oberschule           Floyd
5       Hochschule          George

Gut, jetzt haben wir einen Datenrahmen mit 5 Zeilen. Lassen Sie uns einen weiteren Datenrahmen erstellen.

#Erstellen eines Datenrahmens

Student_details<-c("Bracy","Evin")
Student_class<-c("Oberschule","Hochschule")
Student_rank<-c("A","A+")
df2<-data.frame(Student_class,Student_details,Student_rank)

df2

Gut, jetzt haben wir 2 Datenrahmen unterschiedlicher Zeilenanzahl (df1 und df2). Lassen Sie uns die rbind()-Funktion verwenden, um die oben genannten 2 Datenrahmen in einen einzigen Datenrahmen zu binden.

Lassen Sie uns sehen, wie es funktioniert.

Sie werden nicht glauben, dass der gesamte Bindungsprozess nur eine Zeile Code erfordert.

#bindet Zeilen von 2 Eingabedatenrahmen

rbind(df1,df2)

Der resultierende Datenrahmen wird eine gebundene Version beider Datenrahmen sein, wie im obigen Ausgabe gezeigt.

Verbinden von zwei Datenrahmen unterschiedlicher Länge mit der bind()-Funktion

Nun, im vorherigen Abschnitt haben wir die beiden Zeilengruppen zusammengefügt.

In diesem Abschnitt werden wir zwei Datensätze zusammenführen, indem wir die rbind-Funktion in R verwenden.

#erstellt den Datenrahmen

Student_details<-c("Mark","John","Fredrick","Floyd","George")
Student_class<-c("Oberschule","Hochschule","Oberschule","Oberschule","Hochschule")
df1<-data.frame(Student_class,Student_details)

df1
   Student_class    Student_details
1   Oberschule            Mark
2       Hochschule            John
3   Oberschule        Fredrick
4   Oberschule           Floyd
5       Hochschule          George
#erstellt den Datenrahmen

Student_details<-c("Bracy","Evin")
Student_class<-c("Oberschule","Hochschule")
Student_rank<-c("A","A+")
df2<-data.frame(Student_class,Student_details,Student_rank)
df2
   Student_class   Student_details   Student_rank
1   Oberschule           Bracy            A
2       Hochschule            Evin           A+
rbind(df1,df2)
Error in rbind(deparse.level, ...) : 
  Anzahl der Spalten der Argumente stimmt nicht überein

Oh warte, was ist passiert? Warum gibt die Funktion einen Fehler aus?

Wenn Sie die Zeilen im Fehler lesen, wird angegeben, dass die Anzahl der Spalten nicht übereinstimmt.

Wir haben 2 Spalten in ‚df1‘ und 3 Spalten in ‚df2‘.

Keine Sorge! Wir haben die bind_rows()-Funktion, die uns in diesen Szenarien unterstützen wird.

Die bind_rows()-Funktion zum Verbinden ungleicher Datensätze

bind_rows() ist eine Funktion, die Teil des dplyr-Pakets ist. Wir müssen zuerst das dplyr-Paket importieren, um diese Funktion ausführen zu können.

Wir verwenden die gleichen Datenrahmen, die im obigen Abschnitt vorgestellt wurden, also df1 und df2. Lassen Sie uns sehen, wie es funktioniert.

#installiert benötigte Pakete
install.packages('dplyr')
#importiert Bibliotheken
library(dplyr)
#bindet die Zeilen
bind_rows(df1,df2)
   Student_class    Student_details   Student_rank
1   Oberschule            Mark         <NA>
2       Hochschule            John         <NA>
3   Oberschule        Fredrick         <NA>
4   Oberschule           Floyd         <NA>
5       Hochschule          George         <NA>
6   Oberschule           Bracy          A
7       Hochschule            Evin          A+

Sie können jetzt sehen, dass die bind_rows-Funktion diese beiden ungleichen Datensätze in Bezug auf die Spaltenanzahl kombiniert hat. Die leeren Stellen werden als <NA> markiert.

Verbinden zweier Datensätze mit der rbind()-Funktion in R

In diesem Abschnitt werden wir uns mit dem Verbinden von zwei vollständigen Datensätzen in R befassen.

Lassen Sie uns sehen, wie es funktioniert.

Wir werden den BOD-Datensatz verwenden, da er nur 6 Zeilen hat und Sie auch die gebundenen Zeilen leicht beobachten können.

#bindet zwei Datensätze
rbind(BOD,BOD)
  Zeit Bedarf
1     1    8.3
2     2   10.3
3     3   19.0
4     4   16.0
5     5   15.6
6     7   19.8
---------------
7     1    8.3
8     2   10.3
9     3   19.0
10    4   16.0
11    5   15.6
12    7   19.8

Der BOD-Datensatz hat 6 Zeilen. Da wir die Daten zweimal übergeben, wird die rbind()-Funktion die gleichen Zeilen binden, wie oben gezeigt.

Und vergessen Sie nicht, dass Sie auch die bind_rows()-Funktion haben.

#bindet zwei unterschiedliche Datensätze

bind_rows(BOD,women)
    Zeit  Bedarf  Größe  Gewicht
1     1    8.3     NA     NA
2     2   10.3     NA     NA
3     3   19.0     NA     NA
4     4   16.0     NA     NA
5     5   15.6     NA     NA
6     7   19.8     NA     NA
7    NA     NA     58    115
8    NA     NA     59    117
9    NA     NA     60    120
10   NA     NA     61    123
11   NA     NA     62    126
12   NA     NA     63    129
13   NA     NA     64    132
14   NA     NA     65    135
15   NA     NA     66    139
16   NA     NA     67    142
17   NA     NA     68    146
18   NA     NA     69    150
19   NA     NA     70    154
20   NA     NA     71    159
21   NA     NA     72    164

Diese Beispiele zeigen deutlich die Arbeitsweise und Anwendungen der bind()- und bind_rows-Funktionen.

Ich hoffe, diese Illustrationen haben Ihnen geholfen, diese Funktionen zu verstehen.

Verbinden mehrerer Zeilengruppen in R

In diesem Abschnitt werden wir uns auf das Verbinden mehrerer (mehr als zwei) Zeilengruppen mit der Funktion rbind() konzentrieren. Lassen Sie uns sehen, wie es funktioniert.

#bindet Zeilen von 3 Datensätzen
bind_rows(BOD,women,ToothGrowth)
     Zeit Bedarf Größe Gewicht Länge Ergänzung  Dosis
1     1    8.3     NA     NA   NA  <NA>   NA
2     2   10.3     NA     NA   NA  <NA>   NA
3     3   19.0     NA     NA   NA  <NA>   NA
4     4   16.0     NA     NA   NA  <NA>   NA
5     5   15.6     NA     NA   NA  <NA>   NA
6     7   19.8     NA     NA   NA  <NA>   NA
7    NA     NA     58    115   NA  <NA>   NA
8    NA     NA     59    117   NA  <NA>   NA
9    NA     NA     60    120   NA  <NA>   NA
10   NA     NA     61    123   NA  <NA>   NA
11   NA     NA     62    126   NA  <NA>   NA
12   NA     NA     63    129   NA  <NA>   NA
13   NA     NA     64    132   NA  <NA>   NA
14   NA     NA     65    135   NA  <NA>   NA
15   NA     NA     66    139   NA  <NA>   NA
16   NA     NA     67    142   NA  <NA>   NA
17   NA     NA     68    146   NA  <NA>   NA
18   NA     NA     69    150   NA  <NA>   NA
19   NA     NA     70    154   NA  <NA>   NA
20   NA     NA     71    159   NA  <NA>   NA

Beobachten Sie, wie alle drei Datensätze durch die bind_rows()-Funktion in R verbunden oder kombiniert wurden. Das ist die Schönheit der bind_rows()-Funktion.

Diese beiden Funktionen haben endlose Anwendungen bei der Datenmanipulation in der R-Programmierung.

Zusammenfassung

Die rbind()-Funktion in R und die bind_rows()-Funktion sind die nützlichsten Funktionen, wenn es um Datenmanipulation geht.

Sie können problemlos zwei Datenrahmen mit gleicher Spaltenanzahl mit der rbind()-Funktion in R verbinden.

Zusammenfassung

Die rbind()-Funktion in R und die bind_rows()-Funktion sind die nützlichsten Funktionen, wenn es um Datenmanipulation geht.

Sie können problemlos zwei Datenrahmen mit gleicher Spaltenanzahl mit der rbind()-Funktion in R verbinden.

Ebenso können Sie, wenn die Datenrahmen ungleiche Spaltenanzahlen haben, die bind_rows()-Funktion zusammen mit dem dplyr-Paket verwenden.

Nun, das war’s vorerst, frohes Verbinden!!!

Kostenlosen Account erstellen

Registrieren Sie sich jetzt und erhalten Sie Zugang zu unseren Cloud Produkten.

Das könnte Sie auch interessieren: