Data Science & ML

Pandas-Grundlagen

DataFrames, Series, Indizierung, Auswahl, Filterung, fehlende Werte, Datentypen

22 Interview-Fragen·
Junior
1

Was ist die wichtigste Pandas-Datenstruktur zum Speichern tabellarischer Daten mit benannten Zeilen und Spalten?

Antwort

Der DataFrame ist die zentrale Datenstruktur von Pandas und wurde entwickelt, um zweidimensionale tabellarische Daten zu speichern. Jede Spalte kann einen anderen Datentyp enthalten, und sowohl Zeilen als auch Spalten haben Bezeichnungen (Index). Diese Struktur ähnelt einer Excel-Tabelle oder einer SQL-Tabelle und erleichtert die Manipulation strukturierter Daten.

2

Welche Pandas-Struktur stellt eine einzelne Datenspalte mit einem Index dar?

Antwort

Eine Series ist eine eindimensionale Struktur, die jeden Datentyp (Ganzzahlen, Zeichenketten, Gleitkommazahlen, Python-Objekte) enthalten kann. Jedes Element hat einen zugehörigen Index, der den Zugriff auf Werte über ihre Bezeichnung ermöglicht. Eine aus einem DataFrame extrahierte Spalte wird automatisch in eine Series konvertiert.

3

Wie erstellt man einen DataFrame aus einem Python-Dictionary, bei dem die Schlüssel zu Spaltennamen werden?

Antwort

Die Funktion pd.DataFrame() akzeptiert direkt ein Python-Dictionary. Dictionary-Schlüssel werden automatisch zu Spaltennamen, und Werte (Listen oder Arrays) werden zu den Daten der einzelnen Spalten. Diese Methode ist die häufigste Art, DataFrames aus strukturierten Daten in Python zu erstellen.

4

Welche Methode sollte verwendet werden, um eine CSV-Datei zu lesen und in einen DataFrame zu laden?

5

Welche Methode zeigt die ersten Zeilen eines DataFrame für eine schnelle Datenvorschau an?

+19 Interview-Fragen

Meistere Data Science & ML für dein nächstes Interview

Zugang zu allen Fragen, Flashcards, technischen Tests, Code-Review-Übungen und Interview-Simulatoren.

Kostenlos starten