Effektive Methoden zur Erstellung von Dataframe-Teilmengen in Python
Ein Python Dataframe? Was ist das überhaupt?
Die Python Pandas-Module stellen uns zwei Datenstrukturen zur Verfügung: Series und Dataframe, um Werte zu speichern. Ein Dataframe ist eine Datenstruktur, die Daten in Form einer Matrix speichert, also in Form von Zeilen und Spalten. Mit einem Dataframe können wir Teilmengen auf verschiedene Arten erstellen und darauf zugreifen:
- Zugriff auf Daten nach Zeilen als Teilmengen
- Abrufen von Daten nach Spalten als Teilmengen
- Zugriff auf bestimmte Daten aus bestimmten Zeilen und Spalten als Teilmengen
1. Erstellung eines Dataframes, mit dem wir arbeiten können!
import pandas as pd
data = {"Roll-num": [10,20,30,40,50,60,70], "Age":[12,14,13,12,14,13,15], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}
block = pd.DataFrame(data)
print("Originaler Dataframe:\n")
print(block)
Ausgabe:
Originaler Dataframe:
Roll-num Age NAME
0 10 12 John
1 20 14 Camili
2 30 13 Rheana
3 40 12 Joseph
4 50 14 Amanti
5 60 13 Alexa
6 70 15 Siri
2. Erstellen einer Teilmengen eines Python Dataframes mit der loc() Funktion
Die Python loc()
Funktion ermöglicht es uns, eine Teilmengen eines Dataframes gemäß einer bestimmten Zeile, Spalte oder einer Kombination von beiden zu erstellen. Die loc()
Funktion funktioniert auf der Grundlage von Labels, d.h. wir müssen ihr das Label der Zeile/Spalte angeben, um die benutzerdefinierte Teilmengen zu erstellen.
Beispiel 1: Extrahieren von Daten bestimmter Zeilen eines Dataframes
block.loc[[0,1,3]]
Ausgabe:
Roll-num Age NAME
0 10 12 John
1 20 14 Camili
3 40 12 Joseph
3. Verwendung der Python iloc() Funktion zur Erstellung einer Teilmengen eines Dataframes
Die Python iloc()
Funktion ermöglicht es uns, Teilmengen aus Zeilen und Spalten basierend auf Indexwerten auszuwählen. Anders als die loc()
Funktion, die auf Labels basiert, funktioniert die iloc()
Funktion auf Indexwerten. Wir können eine Teilmengen eines Python Dataframes aus den Daten erstellen, indem wir die Indexnummern der Zeilen und Spalten angeben.
Beispiel:
block.iloc[[0,1,3,6],[0,2]]
Ausgabe:
Roll-num NAME
0 10 John
1 20 Camili
3 40 Joseph
6 70 Siri
4. Verwendung des Indexoperators zur Erstellung einer Teilmengen eines Dataframes
Auf einfache Weise können wir den Indexoperator, d.h. eckige Klammern, verwenden, um eine Teilmengen der Daten zu erstellen.
Beispiel:
block[['Age','NAME']]
Ausgabe:
Age NAME
0 12 John
1 14 Camili
2 13 Rheana
3 12 Joseph
4 14 Amanti
5 13 Alexa
6 15 Siri
Fazit
Damit sind wir am Ende dieses Themas angelangt. Bitte zögern Sie nicht, unten einen Kommentar abzugeben, falls Sie Fragen haben. Für weitere Beiträge zu Python bleiben Sie dran und bis dahin, viel Spaß beim Lernen!