Data Science & ML

Deskriptive Statistik

Mittelwert, Median, Standardabweichung, Quartile, Verteilungen, Korrelationen, Ausreißer, Schiefe

20 Interview-Fragen·
Mid-Level
1

Welches Maß der zentralen Tendenz ist am besten geeignet für Daten mit Extremwerten (Ausreißern)?

Antwort

Der Median ist das robusteste Maß der zentralen Tendenz gegenüber Ausreißern, da er den mittleren Wert sortierter Daten darstellt und nicht von Extremwerten beeinflusst wird. Im Gegensatz zum Mittelwert, der alle Werte summiert, berücksichtigt der Median nur die Position. Bei Gehältern eines Unternehmens mit einigen hochbezahlten Führungskräften gibt der Median beispielsweise eine bessere Darstellung des typischen Gehalts als der Mittelwert.

2

Was ist die Varianz eines Datensatzes?

Antwort

Die Varianz misst die Streuung der Daten um ihren Mittelwert. Sie wird als Durchschnitt der quadrierten Abweichungen vom Mittelwert berechnet. Durch das Quadrieren erhält man stets positive Werte und verstärkt den Einfluss von Werten, die weit vom Mittelwert entfernt sind. Die Einheit der Varianz ist das Quadrat der ursprünglichen Datenmaßeinheit, weshalb häufig die Standardabweichung (Quadratwurzel der Varianz) verwendet wird, um die Streuung in der ursprünglichen Einheit zu interpretieren.

3

Wie ist das Verhältnis zwischen Standardabweichung und Varianz?

Antwort

Die Standardabweichung ist die Quadratwurzel der Varianz. Diese Transformation bringt das Streuungsmaß zurück in die ursprüngliche Datenmaßeinheit und erleichtert die Interpretation. Wenn die Daten in Euro sind, ist die Varianz in Quadrat-Euro (schwer zu interpretieren), während die Standardabweichung in Euro ist. Daher wird die Standardabweichung bevorzugt, um die Datenstreuung intuitiv zu kommunizieren.

4

Was stellt das erste Quartil (Q1) einer Verteilung dar?

5

Wie interpretiert man einen Pearson-Korrelationskoeffizienten von -0.85?

+17 Interview-Fragen

Meistere Data Science & ML für dein nächstes Interview

Zugang zu allen Fragen, Flashcards, technischen Tests, Code-Review-Übungen und Interview-Simulatoren.

Kostenlos starten