
Statystyka opisowa
Średnia vs mediana, wariancja, odchylenie standardowe, rozkład normalny, skośność, korelacja vs przyczynowość, błąd próbkowania, percentyle
1Która miara tendencji centralnej reprezentuje wartość dzielącą posortowany zbiór danych na dwie równe połowy?
Która miara tendencji centralnej reprezentuje wartość dzielącą posortowany zbiór danych na dwie równe połowy?
Odpowiedź
Mediana to środkowa wartość zbioru danych posortowanego rosnąco. Oddziela dokładnie 50% niższych wartości od 50% wyższych. W przeciwieństwie do średniej, mediana nie jest podatna na wartości ekstremalne, co czyni ją bardziej odpornym wskaźnikiem dla rozkładów skośnych, takich jak dochody czy ceny nieruchomości.
2Jaka jest podstawowa różnica między średnią a medianą?
Jaka jest podstawowa różnica między średnią a medianą?
Odpowiedź
Średnia uwzględnia wszystkie wartości i dlatego jest wrażliwa na wartości ekstremalne (outliery), podczas gdy mediana zależy tylko od centralnej pozycji posortowanych danych. Na przykład, jeśli pięć pensji to 30k, 35k, 40k, 45k i 500k, średnia jest podciągana w górę przez 500k (130k), podczas gdy mediana pozostaje na 40k, lepiej odzwierciedlając realia grupy.
3Czym jest moda w zbiorze danych?
Czym jest moda w zbiorze danych?
Odpowiedź
Moda to wartość, która pojawia się najczęściej w zbiorze danych. Zbiór danych może być unimodalny (jedna moda), bimodalny (dwie mody) lub multimodalny (wiele mód). Moda jest jedyną miarą tendencji centralnej, którą można stosować z danymi kategorycznymi, takimi jak ulubiony kolor czy najlepiej sprzedająca się kategoria produktów.
Co mierzy wariancja w zbiorze danych?
Jaki jest związek między wariancją a odchyleniem standardowym?
+17 pytań z rozmów
Inne tematy rekrutacyjne Data Analytics
Google Sheets - Podstawy
Google Sheets - Zaawansowane formuły
SQL - Podstawy
SQL - Agregacje i grupowanie
SQL - Złączenia
BigQuery - Podstawy
Data Cleaning - Czyszczenie danych
KPI i metryki biznesowe
Zapier i automatyzacja No-Code
Zasady wizualizacji danych
Python & Pandas - Podstawy
Google Sheets - Automatyczne dashboardy
SQL - Podzapytania i CTE
SQL - Window Functions
BigQuery - Funkcje zaawansowane
Data Modeling
Analiza funneli i konwersji
Analiza kohort i retencji
Google Tag Manager i tracking
API i webhooki
dbt - Podstawy
AB Testing i statystyka stosowana
Looker Studio (Google Data Studio)
Power BI - Podstawy
SQL - Zaawansowane zapytania analityczne
dbt - Funkcje zaawansowane
Power BI - DAX i zaawansowane dashboardy
Python Analytics - Zaawansowana analiza i ML
Opanuj Data Analytics na następną rozmowę
Uzyskaj dostęp do wszystkich pytań, flashcards, testów technicznych, ćwiczeń code review i symulatorów rozmów.
Zacznij za darmo