
Deskriptive Statistik
Mittelwert vs. Median, Varianz, Standardabweichung, Normalverteilung, Schiefe, Korrelation vs. Kausalität, Stichprobenverzerrung, Perzentile
1Welches Maß der zentralen Tendenz repräsentiert den Wert, der einen sortierten Datensatz in zwei gleiche Hälften teilt?
Welches Maß der zentralen Tendenz repräsentiert den Wert, der einen sortierten Datensatz in zwei gleiche Hälften teilt?
Antwort
Der Median ist der mittlere Wert eines aufsteigend sortierten Datensatzes. Er trennt genau 50 % der niedrigeren Werte von 50 % der höheren Werte. Im Gegensatz zum Mittelwert wird der Median nicht von Extremwerten beeinflusst, was ihn zu einem robusteren Indikator für schiefe Verteilungen wie Einkommen oder Immobilienpreise macht.
2Was ist der grundlegende Unterschied zwischen Mittelwert und Median?
Was ist der grundlegende Unterschied zwischen Mittelwert und Median?
Antwort
Der Mittelwert berücksichtigt alle Werte und ist daher empfindlich gegenüber Extremwerten (Ausreißern), während der Median nur von der zentralen Position der sortierten Daten abhängt. Sind beispielsweise fünf Gehälter 30k, 35k, 40k, 45k und 500k, wird der Mittelwert durch 500k nach oben gezogen (130k), während der Median bei 40k bleibt und die Realität der Gruppe besser widerspiegelt.
3Was ist der Modus in einem Datensatz?
Was ist der Modus in einem Datensatz?
Antwort
Der Modus ist der Wert, der in einem Datensatz am häufigsten vorkommt. Ein Datensatz kann unimodal (ein Modus), bimodal (zwei Modi) oder multimodal (mehrere Modi) sein. Der Modus ist das einzige Maß der zentralen Tendenz, das mit kategorialen Daten wie der Lieblingsfarbe oder der meistverkauften Produktkategorie verwendet werden kann.
Was misst die Varianz in einem Datensatz?
Wie hängen Varianz und Standardabweichung zusammen?
+17 Interview-Fragen
Weitere Data Analytics-Interviewthemen
Google Sheets - Grundlagen
Google Sheets - Erweiterte Formeln
SQL - Grundlagen
SQL - Aggregationen und Gruppierungen
SQL - Joins
BigQuery - Grundlagen
Data Cleaning - Datenbereinigung
KPIs und Business-Metriken
Zapier und No-Code-Automatisierung
Grundlagen der Datenvisualisierung
Python & Pandas - Grundlagen
Google Sheets - Automatisierte Dashboards
SQL - Unterabfragen und CTEs
SQL - Window Functions
BigQuery - Erweiterte Funktionen
Data Modeling
Funnel- und Conversion-Analyse
Kohorten- und Retention-Analyse
Google Tag Manager und Tracking
APIs und Webhooks
dbt - Grundlagen
AB-Testing und angewandte Statistik
Looker Studio (Google Data Studio)
Power BI - Grundlagen
SQL - Erweiterte analytische Abfragen
dbt - Erweiterte Funktionen
Power BI - DAX und fortgeschrittene Dashboards
Python Analytics - Erweiterte Analyse und ML
Meistere Data Analytics für dein nächstes Interview
Zugang zu allen Fragen, Flashcards, technischen Tests, Code-Review-Übungen und Interview-Simulatoren.
Kostenlos starten