Data Analytics

Описова статистика

Середнє vs медіана, дисперсія, стандартне відхилення, нормальний розподіл, асиметрія, кореляція vs причинність, вибіркове зміщення, перцентилі

20 питань зі співбесід·
Junior
1

Який показник центральної тенденції представляє значення, що ділить відсортований набір даних на дві рівні половини?

Відповідь

Медіана — це середнє значення набору даних, відсортованого за зростанням. Вона розділяє рівно 50% нижчих значень від 50% вищих. На відміну від середнього, медіана не зазнає впливу екстремальних значень, що робить її більш надійним показником для асиметричних розподілів, таких як доходи або ціни на нерухомість.

2

Яка фундаментальна різниця між середнім та медіаною?

Відповідь

Середнє враховує всі значення і тому чутливе до екстремальних значень (викидів), тоді як медіана залежить лише від центральної позиції відсортованих даних. Наприклад, якщо п'ять зарплат становлять 30k, 35k, 40k, 45k та 500k, середнє підтягується вгору значенням 500k (130k), тоді як медіана залишається на рівні 40k, краще відображаючи реальність групи.

3

Що таке мода в наборі даних?

Відповідь

Мода — це значення, яке найчастіше зустрічається в наборі даних. Набір даних може бути унімодальним (одна мода), бімодальним (дві моди) або мультимодальним (кілька мод). Мода є єдиним показником центральної тенденції, який можна використовувати з категоріальними даними, такими як улюблений колір або найбільш продавана категорія товарів.

4

Що вимірює дисперсія в наборі даних?

5

Який зв'язок між дисперсією та стандартним відхиленням?

+17 питань зі співбесід

Інші теми співбесід Data Analytics

Google Sheets - Основи

Junior
20 запитань

Google Sheets - Розширені формули

Junior
20 запитань

SQL - Основи

Junior
25 запитань

SQL - Агрегації та групування

Junior
20 запитань

SQL - З'єднання

Junior
20 запитань

BigQuery - Основи

Junior
20 запитань

Data Cleaning - Очищення даних

Junior
20 запитань

KPI та бізнес-метрики

Junior
20 запитань

Zapier та No-Code автоматизація

Junior
20 запитань

Принципи візуалізації даних

Junior
20 запитань

Python & Pandas - Основи

Junior
20 запитань

Google Sheets - Автоматизовані дашборди

Mid-Level
20 запитань

SQL - Підзапити та CTE

Mid-Level
20 запитань

SQL - Window Functions

Mid-Level
20 запитань

BigQuery - Розширені можливості

Mid-Level
20 запитань

Data Modeling

Mid-Level
20 запитань

Аналіз воронок і конверсії

Mid-Level
20 запитань

Аналіз когорт і утримання

Mid-Level
20 запитань

Google Tag Manager та трекінг

Mid-Level
20 запитань

API та вебхуки

Mid-Level
20 запитань

dbt - Основи

Mid-Level
20 запитань

AB Testing та прикладна статистика

Mid-Level
20 запитань

Looker Studio (Google Data Studio)

Mid-Level
20 запитань

Power BI - Основи

Mid-Level
20 запитань

SQL - Розширені аналітичні запити

Senior
20 запитань

dbt - Розширені можливості

Senior
20 запитань

Power BI - DAX та просунуті дашборди

Senior
20 запитань

Python Analytics - Розширений аналіз та ML

Senior
20 запитань

Опануй Data Analytics для наступної співбесіди

Отримай доступ до всіх питань, flashcards, технічних тестів, вправ code review та симуляторів співбесід.

Почни безкоштовно