
Python & Pandas - Grundlagen
DataFrames, Series, Indexierung (loc, iloc), boolesche Filterung, Datentypen, read_csv, describe, info, head/tail, shape, columns
1Was ist die Hauptdatenstruktur von Pandas zum Speichern tabellarischer Daten?
Was ist die Hauptdatenstruktur von Pandas zum Speichern tabellarischer Daten?
Antwort
Das DataFrame ist die zentrale Datenstruktur von Pandas. Es stellt eine zweidimensionale Tabelle mit Zeilen und Spalten dar, ähnlich einem Tabellenkalkulationsblatt oder einer SQL-Tabelle. Jede Spalte ist eine Series, und jede Zeile hat einen Index. Das DataFrame ermöglicht die effiziente Manipulation strukturierter Daten durch seine zahlreichen integrierten Methoden.
2Was ist eine Series in Pandas?
Was ist eine Series in Pandas?
Antwort
Eine Series ist ein eindimensionales Array mit einem Index. Es repräsentiert eine einzelne Datenspalte in einem DataFrame. Jedes Element hat ein Label (Index), das einen schnellen Zugriff per Name oder Position ermöglicht. Eine Series kann nur einen Datentyp (int, float, string usw.) enthalten, was sie von einer einfachen Python-Liste unterscheidet.
3Welche Pandas-Funktion liest eine CSV-Datei und lädt sie in einen DataFrame?
Welche Pandas-Funktion liest eine CSV-Datei und lädt sie in einen DataFrame?
Antwort
Die Funktion pd.read_csv() liest eine CSV-Datei und gibt einen DataFrame zurück. Sie akzeptiert viele Parameter: sep für den Trenner, header für die Kopfzeile, encoding für die Dateikodierung, dtype, um Spaltentypen zu erzwingen, und na_values, um fehlende Werte zu definieren. Es ist die häufigste Methode, um Daten in Pandas zu importieren.
Was gibt das Attribut df.shape bei einem DataFrame zurück?
Welche Methode zeigt die ersten 5 Zeilen eines DataFrame an?
+17 Interview-Fragen
Weitere Data Analytics-Interviewthemen
Google Sheets - Grundlagen
Google Sheets - Erweiterte Formeln
SQL - Grundlagen
SQL - Aggregationen und Gruppierungen
SQL - Joins
BigQuery - Grundlagen
Data Cleaning - Datenbereinigung
KPIs und Business-Metriken
Deskriptive Statistik
Zapier und No-Code-Automatisierung
Grundlagen der Datenvisualisierung
Google Sheets - Automatisierte Dashboards
SQL - Unterabfragen und CTEs
SQL - Window Functions
BigQuery - Erweiterte Funktionen
Data Modeling
Funnel- und Conversion-Analyse
Kohorten- und Retention-Analyse
Google Tag Manager und Tracking
APIs und Webhooks
dbt - Grundlagen
AB-Testing und angewandte Statistik
Looker Studio (Google Data Studio)
Power BI - Grundlagen
SQL - Erweiterte analytische Abfragen
dbt - Erweiterte Funktionen
Power BI - DAX und fortgeschrittene Dashboards
Python Analytics - Erweiterte Analyse und ML
Meistere Data Analytics für dein nächstes Interview
Zugang zu allen Fragen, Flashcards, technischen Tests, Code-Review-Übungen und Interview-Simulatoren.
Kostenlos starten