Effektive Methoden zur Erstellung von Dataframe-Teilmengen in Python

 

Erfahren Sie in unserem neuesten Blogbeitrag, wie Sie mithilfe von Python Pandas Dataframes spielend leicht Teilmengen erstellen können. Entdecken Sie drei verschiedene Methoden zur effektiven Datenfilterung und -manipulation.

Ein Python Dataframe? Was ist das überhaupt?

Die Python Pandas-Module stellen uns zwei Datenstrukturen zur Verfügung: Series und Dataframe, um Werte zu speichern. Ein Dataframe ist eine Datenstruktur, die Daten in Form einer Matrix speichert, also in Form von Zeilen und Spalten. Mit einem Dataframe können wir Teilmengen auf verschiedene Arten erstellen und darauf zugreifen:

  • Zugriff auf Daten nach Zeilen als Teilmengen
  • Abrufen von Daten nach Spalten als Teilmengen
  • Zugriff auf bestimmte Daten aus bestimmten Zeilen und Spalten als Teilmengen

1. Erstellung eines Dataframes, mit dem wir arbeiten können!

import pandas as pd 
data = {"Roll-num": [10,20,30,40,50,60,70], "Age":[12,14,13,12,14,13,15], "NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']}
block = pd.DataFrame(data)
print("Originaler Dataframe:\n")
print(block)

Ausgabe:


Originaler Dataframe:

   Roll-num  Age    NAME
0        10   12    John
1        20   14  Camili
2        30   13  Rheana
3        40   12  Joseph
4        50   14  Amanti
5        60   13   Alexa
6        70   15    Siri


2. Erstellen einer Teilmengen eines Python Dataframes mit der loc() Funktion

Die Python loc() Funktion ermöglicht es uns, eine Teilmengen eines Dataframes gemäß einer bestimmten Zeile, Spalte oder einer Kombination von beiden zu erstellen. Die loc() Funktion funktioniert auf der Grundlage von Labels, d.h. wir müssen ihr das Label der Zeile/Spalte angeben, um die benutzerdefinierte Teilmengen zu erstellen.

Beispiel 1: Extrahieren von Daten bestimmter Zeilen eines Dataframes

Ausgabe:


   Roll-num  Age    NAME
0        10   12    John
1        20   14  Camili
3        40   12  Joseph


3. Verwendung der Python iloc() Funktion zur Erstellung einer Teilmengen eines Dataframes

Die Python iloc() Funktion ermöglicht es uns, Teilmengen aus Zeilen und Spalten basierend auf Indexwerten auszuwählen. Anders als die loc() Funktion, die auf Labels basiert, funktioniert die iloc() Funktion auf Indexwerten. Wir können eine Teilmengen eines Python Dataframes aus den Daten erstellen, indem wir die Indexnummern der Zeilen und Spalten angeben.

Beispiel:

Ausgabe:


   Roll-num    NAME
0        10    John
1        20  Camili
3        40  Joseph
6        70    Siri


4. Verwendung des Indexoperators zur Erstellung einer Teilmengen eines Dataframes

Auf einfache Weise können wir den Indexoperator, d.h. eckige Klammern, verwenden, um eine Teilmengen der Daten zu erstellen.

Beispiel:

Ausgabe:


   Age    NAME
0   12    John
1   14  Camili
2   13  Rheana
3   12  Joseph
4   14  Amanti
5   13   Alexa
6   15    Siri


Fazit

Damit sind wir am Ende dieses Themas angelangt. Bitte zögern Sie nicht, unten einen Kommentar abzugeben, falls Sie Fragen haben. Für weitere Beiträge zu Python bleiben Sie dran und bis dahin, viel Spaß beim Lernen!

Quelle: digitalocean.com

Jetzt 200€ Guthaben sichern

Registrieren Sie sich jetzt in unserer ccloud³ und erhalten Sie 200€ Startguthaben für Ihr Projekt.

Das könnte Sie auch interessieren:

Moderne Hosting Services mit Cloud Server, Managed Server und skalierbarem Cloud Hosting für professionelle IT-Infrastrukturen

Flask-Projekte mit Poetry unter Ubuntu 24.04 verwalten

Python, Tutorial
Poetry installieren und Flask-Abhängigkeiten unter Ubuntu 24.04 verwalten Poetry ist ein kostenloses Open-Source-Werkzeug, das die Verwaltung von Abhängigkeiten und das Packaging von Python-Projekten vereinfacht. Es liefert einen klaren Überblick über…