Data Analytics

Statystyka opisowa

Średnia vs mediana, wariancja, odchylenie standardowe, rozkład normalny, skośność, korelacja vs przyczynowość, błąd próbkowania, percentyle

20 pytań z rozmów·
Junior
1

Która miara tendencji centralnej reprezentuje wartość dzielącą posortowany zbiór danych na dwie równe połowy?

Odpowiedź

Mediana to środkowa wartość zbioru danych posortowanego rosnąco. Oddziela dokładnie 50% niższych wartości od 50% wyższych. W przeciwieństwie do średniej, mediana nie jest podatna na wartości ekstremalne, co czyni ją bardziej odpornym wskaźnikiem dla rozkładów skośnych, takich jak dochody czy ceny nieruchomości.

2

Jaka jest podstawowa różnica między średnią a medianą?

Odpowiedź

Średnia uwzględnia wszystkie wartości i dlatego jest wrażliwa na wartości ekstremalne (outliery), podczas gdy mediana zależy tylko od centralnej pozycji posortowanych danych. Na przykład, jeśli pięć pensji to 30k, 35k, 40k, 45k i 500k, średnia jest podciągana w górę przez 500k (130k), podczas gdy mediana pozostaje na 40k, lepiej odzwierciedlając realia grupy.

3

Czym jest moda w zbiorze danych?

Odpowiedź

Moda to wartość, która pojawia się najczęściej w zbiorze danych. Zbiór danych może być unimodalny (jedna moda), bimodalny (dwie mody) lub multimodalny (wiele mód). Moda jest jedyną miarą tendencji centralnej, którą można stosować z danymi kategorycznymi, takimi jak ulubiony kolor czy najlepiej sprzedająca się kategoria produktów.

4

Co mierzy wariancja w zbiorze danych?

5

Jaki jest związek między wariancją a odchyleniem standardowym?

+17 pytań z rozmów

Opanuj Data Analytics na następną rozmowę

Uzyskaj dostęp do wszystkich pytań, flashcards, testów technicznych, ćwiczeń code review i symulatorów rozmów.

Zacznij za darmo