Data Analytics

Deskriptive Statistik

Mittelwert vs. Median, Varianz, Standardabweichung, Normalverteilung, Schiefe, Korrelation vs. Kausalität, Stichprobenverzerrung, Perzentile

20 Interview-Fragen·
Junior
1

Welches Maß der zentralen Tendenz repräsentiert den Wert, der einen sortierten Datensatz in zwei gleiche Hälften teilt?

Antwort

Der Median ist der mittlere Wert eines aufsteigend sortierten Datensatzes. Er trennt genau 50 % der niedrigeren Werte von 50 % der höheren Werte. Im Gegensatz zum Mittelwert wird der Median nicht von Extremwerten beeinflusst, was ihn zu einem robusteren Indikator für schiefe Verteilungen wie Einkommen oder Immobilienpreise macht.

2

Was ist der grundlegende Unterschied zwischen Mittelwert und Median?

Antwort

Der Mittelwert berücksichtigt alle Werte und ist daher empfindlich gegenüber Extremwerten (Ausreißern), während der Median nur von der zentralen Position der sortierten Daten abhängt. Sind beispielsweise fünf Gehälter 30k, 35k, 40k, 45k und 500k, wird der Mittelwert durch 500k nach oben gezogen (130k), während der Median bei 40k bleibt und die Realität der Gruppe besser widerspiegelt.

3

Was ist der Modus in einem Datensatz?

Antwort

Der Modus ist der Wert, der in einem Datensatz am häufigsten vorkommt. Ein Datensatz kann unimodal (ein Modus), bimodal (zwei Modi) oder multimodal (mehrere Modi) sein. Der Modus ist das einzige Maß der zentralen Tendenz, das mit kategorialen Daten wie der Lieblingsfarbe oder der meistverkauften Produktkategorie verwendet werden kann.

4

Was misst die Varianz in einem Datensatz?

5

Wie hängen Varianz und Standardabweichung zusammen?

+17 Interview-Fragen

Meistere Data Analytics für dein nächstes Interview

Zugang zu allen Fragen, Flashcards, technischen Tests, Code-Review-Übungen und Interview-Simulatoren.

Kostenlos starten