Data Analytics

Python & Pandas - Grundlagen

DataFrames, Series, Indexierung (loc, iloc), boolesche Filterung, Datentypen, read_csv, describe, info, head/tail, shape, columns

20 Interview-Fragen·
Junior
1

Was ist die Hauptdatenstruktur von Pandas zum Speichern tabellarischer Daten?

Antwort

Das DataFrame ist die zentrale Datenstruktur von Pandas. Es stellt eine zweidimensionale Tabelle mit Zeilen und Spalten dar, ähnlich einem Tabellenkalkulationsblatt oder einer SQL-Tabelle. Jede Spalte ist eine Series, und jede Zeile hat einen Index. Das DataFrame ermöglicht die effiziente Manipulation strukturierter Daten durch seine zahlreichen integrierten Methoden.

2

Was ist eine Series in Pandas?

Antwort

Eine Series ist ein eindimensionales Array mit einem Index. Es repräsentiert eine einzelne Datenspalte in einem DataFrame. Jedes Element hat ein Label (Index), das einen schnellen Zugriff per Name oder Position ermöglicht. Eine Series kann nur einen Datentyp (int, float, string usw.) enthalten, was sie von einer einfachen Python-Liste unterscheidet.

3

Welche Pandas-Funktion liest eine CSV-Datei und lädt sie in einen DataFrame?

Antwort

Die Funktion pd.read_csv() liest eine CSV-Datei und gibt einen DataFrame zurück. Sie akzeptiert viele Parameter: sep für den Trenner, header für die Kopfzeile, encoding für die Dateikodierung, dtype, um Spaltentypen zu erzwingen, und na_values, um fehlende Werte zu definieren. Es ist die häufigste Methode, um Daten in Pandas zu importieren.

4

Was gibt das Attribut df.shape bei einem DataFrame zurück?

5

Welche Methode zeigt die ersten 5 Zeilen eines DataFrame an?

+17 Interview-Fragen

Meistere Data Analytics für dein nächstes Interview

Zugang zu allen Fragen, Flashcards, technischen Tests, Code-Review-Übungen und Interview-Simulatoren.

Kostenlos starten