Effektive Methoden zur Erstellung von Dataframe-Teilmengen in Python

 

Erfahren Sie in unserem neuesten Blogbeitrag, wie Sie mithilfe von Python Pandas Dataframes spielend leicht Teilmengen erstellen können. Entdecken Sie drei verschiedene Methoden zur effektiven Datenfilterung und -manipulation.

Ein Python Dataframe? Was ist das überhaupt?

Die Python Pandas-Module stellen uns zwei Datenstrukturen zur Verfügung: Series und Dataframe, um Werte zu speichern. Ein Dataframe ist eine Datenstruktur, die Daten in Form einer Matrix speichert, also in Form von Zeilen und Spalten. Mit einem Dataframe können wir Teilmengen auf verschiedene Arten erstellen und darauf zugreifen:

  • Zugriff auf Daten nach Zeilen als Teilmengen
  • Abrufen von Daten nach Spalten als Teilmengen
  • Zugriff auf bestimmte Daten aus bestimmten Zeilen und Spalten als Teilmengen

1. Erstellung eines Dataframes, mit dem wir arbeiten können!

import pandas as pd 
data = {"Roll-num": [10,20,30,40,50,60,70], "Age":[12,14,13,12,14,13,15], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}
block = pd.DataFrame(data)
print("Originaler Dataframe:\n")
print(block)

Ausgabe:


Originaler Dataframe:

   Roll-num  Age    NAME
0        10   12    John
1        20   14  Camili
2        30   13  Rheana
3        40   12  Joseph
4        50   14  Amanti
5        60   13   Alexa
6        70   15    Siri


2. Erstellen einer Teilmengen eines Python Dataframes mit der loc() Funktion

Die Python loc() Funktion ermöglicht es uns, eine Teilmengen eines Dataframes gemäß einer bestimmten Zeile, Spalte oder einer Kombination von beiden zu erstellen. Die loc() Funktion funktioniert auf der Grundlage von Labels, d.h. wir müssen ihr das Label der Zeile/Spalte angeben, um die benutzerdefinierte Teilmengen zu erstellen.

Beispiel 1: Extrahieren von Daten bestimmter Zeilen eines Dataframes

Ausgabe:


   Roll-num  Age    NAME
0        10   12    John
1        20   14  Camili
3        40   12  Joseph


3. Verwendung der Python iloc() Funktion zur Erstellung einer Teilmengen eines Dataframes

Die Python iloc() Funktion ermöglicht es uns, Teilmengen aus Zeilen und Spalten basierend auf Indexwerten auszuwählen. Anders als die loc() Funktion, die auf Labels basiert, funktioniert die iloc() Funktion auf Indexwerten. Wir können eine Teilmengen eines Python Dataframes aus den Daten erstellen, indem wir die Indexnummern der Zeilen und Spalten angeben.

Beispiel:

Ausgabe:


   Roll-num    NAME
0        10    John
1        20  Camili
3        40  Joseph
6        70    Siri


4. Verwendung des Indexoperators zur Erstellung einer Teilmengen eines Dataframes

Auf einfache Weise können wir den Indexoperator, d.h. eckige Klammern, verwenden, um eine Teilmengen der Daten zu erstellen.

Beispiel:

Ausgabe:


   Age    NAME
0   12    John
1   14  Camili
2   13  Rheana
3   12  Joseph
4   14  Amanti
5   13   Alexa
6   15    Siri


Fazit

Damit sind wir am Ende dieses Themas angelangt. Bitte zögern Sie nicht, unten einen Kommentar abzugeben, falls Sie Fragen haben. Für weitere Beiträge zu Python bleiben Sie dran und bis dahin, viel Spaß beim Lernen!

Kostenlosen Account erstellen

Registrieren Sie sich jetzt und erhalten Sie Zugang zu unseren Cloud Produkten.

Das könnte Sie auch interessieren: