Question 1

Was ist die wichtigste Pandas-Datenstruktur zum Speichern tabellarischer Daten mit benannten Zeilen und Spalten?

Accepted Answer

Der DataFrame ist die zentrale Datenstruktur von Pandas und wurde entwickelt, um zweidimensionale tabellarische Daten zu speichern. Jede Spalte kann einen anderen Datentyp enthalten, und sowohl Zeilen als auch Spalten haben Bezeichnungen (Index). Diese Struktur ähnelt einer Excel-Tabelle oder einer SQL-Tabelle und erleichtert die Manipulation strukturierter Daten.

Question 2

Welche Pandas-Struktur stellt eine einzelne Datenspalte mit einem Index dar?

Accepted Answer

Eine Series ist eine eindimensionale Struktur, die jeden Datentyp (Ganzzahlen, Zeichenketten, Gleitkommazahlen, Python-Objekte) enthalten kann. Jedes Element hat einen zugehörigen Index, der den Zugriff auf Werte über ihre Bezeichnung ermöglicht. Eine aus einem DataFrame extrahierte Spalte wird automatisch in eine Series konvertiert.

Question 3

Wie erstellt man einen DataFrame aus einem Python-Dictionary, bei dem die Schlüssel zu Spaltennamen werden?

Accepted Answer

Die Funktion pd.DataFrame() akzeptiert direkt ein Python-Dictionary. Dictionary-Schlüssel werden automatisch zu Spaltennamen, und Werte (Listen oder Arrays) werden zu den Daten der einzelnen Spalten. Diese Methode ist die häufigste Art, DataFrames aus strukturierten Daten in Python zu erstellen.

Pandas-Grundlagen

Was ist die wichtigste Pandas-Datenstruktur zum Speichern tabellarischer Daten mit benannten Zeilen und Spalten?

Antwort

Welche Pandas-Struktur stellt eine einzelne Datenspalte mit einem Index dar?

Antwort

Wie erstellt man einen DataFrame aus einem Python-Dictionary, bei dem die Schlüssel zu Spaltennamen werden?

Antwort

Welche Methode sollte verwendet werden, um eine CSV-Datei zu lesen und in einen DataFrame zu laden?

Welche Methode zeigt die ersten Zeilen eines DataFrame für eine schnelle Datenvorschau an?

Weitere Data Science & ML-Interviewthemen

Python-Grundlagen

Python Objektorientierte Programmierung

Python-Datenstrukturen

Git-Grundlagen

SQL-Grundlagen

NumPy-Grundlagen

Jupyter & Google Colab

SQL Joins & fortgeschrittene Abfragen

Fortgeschrittenes Pandas

Visualisierung mit Matplotlib & Seaborn

Interaktive Visualisierungen mit Plotly

Deskriptive Statistik

Inferenzstatistik

Web Scraping

BigQuery & Cloud Data

Feature Engineering

Überwachtes ML: Regression

Überwachtes ML: Klassifikation

Entscheidungsbäume & Ensembles

Unüberwachtes ML

ML-Pipelines & Validierung

Zeitreihen & Prognosen

Grundlagen des Deep Learning

TensorFlow & Keras

CNN und Bildklassifizierung

RNN & Sequenzen

Transformers & Attention

NLP & Hugging Face

GenAI & LangChain

MLOps und Deployment

Meistere Data Science & ML für dein nächstes Interview