Question 1

Was ist die Hauptdatenstruktur von Pandas zum Speichern tabellarischer Daten?

Accepted Answer

Das DataFrame ist die zentrale Datenstruktur von Pandas. Es stellt eine zweidimensionale Tabelle mit Zeilen und Spalten dar, ähnlich einem Tabellenkalkulationsblatt oder einer SQL-Tabelle. Jede Spalte ist eine Series, und jede Zeile hat einen Index. Das DataFrame ermöglicht die effiziente Manipulation strukturierter Daten durch seine zahlreichen integrierten Methoden.

Question 2

Was ist eine Series in Pandas?

Accepted Answer

Eine Series ist ein eindimensionales Array mit einem Index. Es repräsentiert eine einzelne Datenspalte in einem DataFrame. Jedes Element hat ein Label (Index), das einen schnellen Zugriff per Name oder Position ermöglicht. Eine Series kann nur einen Datentyp (int, float, string usw.) enthalten, was sie von einer einfachen Python-Liste unterscheidet.

Question 3

Welche Pandas-Funktion liest eine CSV-Datei und lädt sie in einen DataFrame?

Accepted Answer

Die Funktion pd.read_csv() liest eine CSV-Datei und gibt einen DataFrame zurück. Sie akzeptiert viele Parameter: sep für den Trenner, header für die Kopfzeile, encoding für die Dateikodierung, dtype, um Spaltentypen zu erzwingen, und na_values, um fehlende Werte zu definieren. Es ist die häufigste Methode, um Daten in Pandas zu importieren.

Python & Pandas - Grundlagen

Was ist die Hauptdatenstruktur von Pandas zum Speichern tabellarischer Daten?

Antwort

Was ist eine Series in Pandas?

Antwort

Welche Pandas-Funktion liest eine CSV-Datei und lädt sie in einen DataFrame?

Antwort

Was gibt das Attribut df.shape bei einem DataFrame zurück?

Welche Methode zeigt die ersten 5 Zeilen eines DataFrame an?

Weitere Data Analytics-Interviewthemen

Google Sheets - Grundlagen

Google Sheets - Erweiterte Formeln

SQL - Grundlagen

SQL - Aggregationen und Gruppierungen

SQL - Joins

BigQuery - Grundlagen

Data Cleaning - Datenbereinigung

KPIs und Business-Metriken

Deskriptive Statistik

Zapier und No-Code-Automatisierung

Grundlagen der Datenvisualisierung

Google Sheets - Automatisierte Dashboards

SQL - Unterabfragen und CTEs

SQL - Window Functions

BigQuery - Erweiterte Funktionen

Data Modeling

Funnel- und Conversion-Analyse

Kohorten- und Retention-Analyse

Google Tag Manager und Tracking

APIs und Webhooks

dbt - Grundlagen

AB-Testing und angewandte Statistik

Looker Studio (Google Data Studio)

Power BI - Grundlagen

SQL - Erweiterte analytische Abfragen

dbt - Erweiterte Funktionen

Power BI - DAX und fortgeschrittene Dashboards

Python Analytics - Erweiterte Analyse und ML

Meistere Data Analytics für dein nächstes Interview