
Описова статистика
Середнє vs медіана, дисперсія, стандартне відхилення, нормальний розподіл, асиметрія, кореляція vs причинність, вибіркове зміщення, перцентилі
1Який показник центральної тенденції представляє значення, що ділить відсортований набір даних на дві рівні половини?
Який показник центральної тенденції представляє значення, що ділить відсортований набір даних на дві рівні половини?
Відповідь
Медіана — це середнє значення набору даних, відсортованого за зростанням. Вона розділяє рівно 50% нижчих значень від 50% вищих. На відміну від середнього, медіана не зазнає впливу екстремальних значень, що робить її більш надійним показником для асиметричних розподілів, таких як доходи або ціни на нерухомість.
2Яка фундаментальна різниця між середнім та медіаною?
Яка фундаментальна різниця між середнім та медіаною?
Відповідь
Середнє враховує всі значення і тому чутливе до екстремальних значень (викидів), тоді як медіана залежить лише від центральної позиції відсортованих даних. Наприклад, якщо п'ять зарплат становлять 30k, 35k, 40k, 45k та 500k, середнє підтягується вгору значенням 500k (130k), тоді як медіана залишається на рівні 40k, краще відображаючи реальність групи.
3Що таке мода в наборі даних?
Що таке мода в наборі даних?
Відповідь
Мода — це значення, яке найчастіше зустрічається в наборі даних. Набір даних може бути унімодальним (одна мода), бімодальним (дві моди) або мультимодальним (кілька мод). Мода є єдиним показником центральної тенденції, який можна використовувати з категоріальними даними, такими як улюблений колір або найбільш продавана категорія товарів.
Що вимірює дисперсія в наборі даних?
Який зв'язок між дисперсією та стандартним відхиленням?
+17 питань зі співбесід
Інші теми співбесід Data Analytics
Google Sheets - Основи
Google Sheets - Розширені формули
SQL - Основи
SQL - Агрегації та групування
SQL - З'єднання
BigQuery - Основи
Data Cleaning - Очищення даних
KPI та бізнес-метрики
Zapier та No-Code автоматизація
Принципи візуалізації даних
Python & Pandas - Основи
Google Sheets - Автоматизовані дашборди
SQL - Підзапити та CTE
SQL - Window Functions
BigQuery - Розширені можливості
Data Modeling
Аналіз воронок і конверсії
Аналіз когорт і утримання
Google Tag Manager та трекінг
API та вебхуки
dbt - Основи
AB Testing та прикладна статистика
Looker Studio (Google Data Studio)
Power BI - Основи
SQL - Розширені аналітичні запити
dbt - Розширені можливості
Power BI - DAX та просунуті дашборди
Python Analytics - Розширений аналіз та ML
Опануй Data Analytics для наступної співбесіди
Отримай доступ до всіх питань, flashcards, технічних тестів, вправ code review та симуляторів співбесід.
Почни безкоштовно