
Pandas-Grundlagen
DataFrames, Series, Indizierung, Auswahl, Filterung, fehlende Werte, Datentypen
1Was ist die wichtigste Pandas-Datenstruktur zum Speichern tabellarischer Daten mit benannten Zeilen und Spalten?
Was ist die wichtigste Pandas-Datenstruktur zum Speichern tabellarischer Daten mit benannten Zeilen und Spalten?
Antwort
Der DataFrame ist die zentrale Datenstruktur von Pandas und wurde entwickelt, um zweidimensionale tabellarische Daten zu speichern. Jede Spalte kann einen anderen Datentyp enthalten, und sowohl Zeilen als auch Spalten haben Bezeichnungen (Index). Diese Struktur ähnelt einer Excel-Tabelle oder einer SQL-Tabelle und erleichtert die Manipulation strukturierter Daten.
2Welche Pandas-Struktur stellt eine einzelne Datenspalte mit einem Index dar?
Welche Pandas-Struktur stellt eine einzelne Datenspalte mit einem Index dar?
Antwort
Eine Series ist eine eindimensionale Struktur, die jeden Datentyp (Ganzzahlen, Zeichenketten, Gleitkommazahlen, Python-Objekte) enthalten kann. Jedes Element hat einen zugehörigen Index, der den Zugriff auf Werte über ihre Bezeichnung ermöglicht. Eine aus einem DataFrame extrahierte Spalte wird automatisch in eine Series konvertiert.
3Wie erstellt man einen DataFrame aus einem Python-Dictionary, bei dem die Schlüssel zu Spaltennamen werden?
Wie erstellt man einen DataFrame aus einem Python-Dictionary, bei dem die Schlüssel zu Spaltennamen werden?
Antwort
Die Funktion pd.DataFrame() akzeptiert direkt ein Python-Dictionary. Dictionary-Schlüssel werden automatisch zu Spaltennamen, und Werte (Listen oder Arrays) werden zu den Daten der einzelnen Spalten. Diese Methode ist die häufigste Art, DataFrames aus strukturierten Daten in Python zu erstellen.
Welche Methode sollte verwendet werden, um eine CSV-Datei zu lesen und in einen DataFrame zu laden?
Welche Methode zeigt die ersten Zeilen eines DataFrame für eine schnelle Datenvorschau an?
+19 Interview-Fragen
Weitere Data Science & ML-Interviewthemen
Python-Grundlagen
Python Objektorientierte Programmierung
Python-Datenstrukturen
Git-Grundlagen
SQL-Grundlagen
NumPy-Grundlagen
Jupyter & Google Colab
SQL Joins & fortgeschrittene Abfragen
Fortgeschrittenes Pandas
Visualisierung mit Matplotlib & Seaborn
Interaktive Visualisierungen mit Plotly
Deskriptive Statistik
Inferenzstatistik
Web Scraping
BigQuery & Cloud Data
Feature Engineering
Überwachtes ML: Regression
Überwachtes ML: Klassifikation
Entscheidungsbäume & Ensembles
Unüberwachtes ML
ML-Pipelines & Validierung
Zeitreihen & Prognosen
Grundlagen des Deep Learning
TensorFlow & Keras
CNN und Bildklassifizierung
RNN & Sequenzen
Transformers & Attention
NLP & Hugging Face
GenAI & LangChain
MLOps und Deployment
Meistere Data Science & ML für dein nächstes Interview
Zugang zu allen Fragen, Flashcards, technischen Tests, Code-Review-Übungen und Interview-Simulatoren.
Kostenlos starten