Data Analytics

Data Cleaning - Очищення даних

Відсутні значення, дублікати, викиди, бізнес-правила, перетворення, якість даних

20 питань зі співбесід·
Junior
1

Що таке відсутнє значення (missing value) у наборі даних?

Відповідь

Відсутнє значення представляє відсутні або незаповнені дані в полі. Воно може з'являтися як порожня комірка, NULL у базі даних або NaN у DataFrame. Виявлення відсутніх значень є першим кроком очищення даних, оскільки вони можуть спотворити статистичні аналізи та агрегації.

2

Яка різниця між значенням NULL і порожнім рядком у базі даних?

Відповідь

NULL означає, що значення невідоме або не існує, тоді як порожній рядок — це відоме значення, яке виявилося порожнім. Це розрізнення є основоположним у SQL, оскільки NULL не можна порівнювати оператором = (треба використовувати IS NULL), а порожній рядок можна порівнювати нормально через = ''.

3

Що таке дублікат у наборі даних?

Відповідь

Дублікат — це запис, який з'являється більше одного разу в наборі даних, або точно (усі стовпці ідентичні), або частково (деякі ключові стовпці ідентичні). Дублікати спотворюють підрахунки, суми та середні значення. Їх виявлення зазвичай ґрунтується на ідентифікації ключових стовпців, які повинні бути унікальними.

4

Яка техніка дозволяє виявляти точні дублікати в SQL?

5

Що таке outlier (викидове значення) у наборі даних?

+17 питань зі співбесід

Інші теми співбесід Data Analytics

Google Sheets - Основи

Junior
20 запитань

Google Sheets - Розширені формули

Junior
20 запитань

SQL - Основи

Junior
25 запитань

SQL - Агрегації та групування

Junior
20 запитань

SQL - З'єднання

Junior
20 запитань

BigQuery - Основи

Junior
20 запитань

KPI та бізнес-метрики

Junior
20 запитань

Описова статистика

Junior
20 запитань

Zapier та No-Code автоматизація

Junior
20 запитань

Принципи візуалізації даних

Junior
20 запитань

Python & Pandas - Основи

Junior
20 запитань

Google Sheets - Автоматизовані дашборди

Mid-Level
20 запитань

SQL - Підзапити та CTE

Mid-Level
20 запитань

SQL - Window Functions

Mid-Level
20 запитань

BigQuery - Розширені можливості

Mid-Level
20 запитань

Data Modeling

Mid-Level
20 запитань

Аналіз воронок і конверсії

Mid-Level
20 запитань

Аналіз когорт і утримання

Mid-Level
20 запитань

Google Tag Manager та трекінг

Mid-Level
20 запитань

API та вебхуки

Mid-Level
20 запитань

dbt - Основи

Mid-Level
20 запитань

AB Testing та прикладна статистика

Mid-Level
20 запитань

Looker Studio (Google Data Studio)

Mid-Level
20 запитань

Power BI - Основи

Mid-Level
20 запитань

SQL - Розширені аналітичні запити

Senior
20 запитань

dbt - Розширені можливості

Senior
20 запитань

Power BI - DAX та просунуті дашборди

Senior
20 запитань

Python Analytics - Розширений аналіз та ML

Senior
20 запитань

Опануй Data Analytics для наступної співбесіди

Отримай доступ до всіх питань, flashcards, технічних тестів, вправ code review та симуляторів співбесід.

Почни безкоштовно