Question 1

Що таке star schema?

Accepted Answer

Star schema — це вимірна модель даних, де центральна fact table оточена dimension table. Fact table містить метрики та foreign key до вимірів, які містять описові атрибути. Ця проста, денормалізована структура оптимізує продуктивність аналітичних запитів, мінімізуючи join.

Question 2

У чому різниця між fact table та dimension table?

Accepted Answer

Fact table містить кількісні показники (метрики) та foreign key до вимірів. Вона записує події або транзакції. Dimension table містить описові атрибути (хто, що, де, коли), що дозволяють фільтрувати та групувати факти. Факти числові та агрегуються, виміри текстові та описові.

Question 3

Що таке grain fact table?

Accepted Answer

Grain визначає рівень деталізації одного рядка у fact table. Він відповідає на питання: що саме представляє один рядок? Наприклад, один продаж на рядок, один продаж на день на продукт або один продаж на годину. Визначення grain є першим кроком вимірного моделювання, оскільки воно визначає, які виміри потрібні та який рівень агрегації зберігається.

Data Modeling для Data Engineering

Що таке star schema?

Відповідь

У чому різниця між fact table та dimension table?

Відповідь

Що таке grain fact table?

Відповідь

У чому різниця між star schema та snowflake schema?

Що таке conformed dimension?

Інші теми співбесід Data Engineering

Linux & Shell - Основи

Git & GitHub - Основи

Просунутий Python для Data Engineering

Docker - Основи

Google Cloud Platform - Основи

CI/CD та якість коду

Docker Compose

FastAPI - API даних

Просунутий SQL для Data Engineering

Data Lake - Архітектура та завантаження даних

BigQuery для Data Engineering

PostgreSQL - Адміністрування

Fivetran & Airbyte - Завантаження даних

dbt - Основи

Apache Airflow - Основи

Kubernetes - Основи

dbt - Розширені можливості

Патерни ETL / ELT / ETLT

Apache Airflow - Просунутий

Airflow + dbt - Оркестрація пайплайнів

PySpark - Великомасштабна обробка

Google Pub/Sub - Стрімінг даних

Apache Beam & Dataflow

Kubernetes - Продакшн та масштабування

Terraform - Infrastructure as Code

Бази даних NoSQL

Сучасна Data Architecture

Моніторинг та спостережуваність

IAM та безпека даних

Опануй Data Engineering для наступної співбесіди