
dbt - Основи
Проєкт dbt, models, sources, refs, tests, документація, materializations, seeds
1Що таке dbt (data build tool)?
Що таке dbt (data build tool)?
Відповідь
dbt — це інструмент трансформації даних, який дозволяє аналітикам та інженерам даних писати перетворення на SQL або Python безпосередньо у сховищі даних. Він використовує підхід ELT (Extract, Load, Transform), де дані спочатку завантажуються у сховище, а потім перетворюються на місці, на відміну від традиційного ETL, який перетворює перед завантаженням. dbt автоматично керує залежностями між моделями, тестами та документацією.
2Яка базова структура проєкту dbt?
Яка базова структура проєкту dbt?
Відповідь
Проєкт dbt організований навколо ключових папок: models/ містить SQL-файли, що визначають перетворення, seeds/ зберігає CSV-файли, що завантажуються як таблиці, tests/ зберігає користувацькі тести, macros/ має багаторазові функції Jinja, а snapshots/ зберігає знімки стану. Файл dbt_project.yml у корені налаштовує проєкт (назва, версія, materializations за замовчуванням), тоді як profiles.yml визначає підключення до сховища.
3Що таке model у dbt?
Що таке model у dbt?
Відповідь
Model dbt — це SQL-файл, що містить інструкцію SELECT, яка визначає перетворення даних. Кожен model відповідає файлу .sql у папці models/ і створює таблицю або представлення у сховищі даних під час виконання. Models можуть посилатися на інші models через функцію ref(), створюючи граф залежностей (DAG), який dbt виконує у правильному порядку.
Яке призначення функції ref() у dbt?
Що таке source у dbt та як її оголосити?
+17 питань зі співбесід
Інші теми співбесід Data Analytics
Google Sheets - Основи
Google Sheets - Розширені формули
SQL - Основи
SQL - Агрегації та групування
SQL - З'єднання
BigQuery - Основи
Data Cleaning - Очищення даних
KPI та бізнес-метрики
Описова статистика
Zapier та No-Code автоматизація
Принципи візуалізації даних
Python & Pandas - Основи
Google Sheets - Автоматизовані дашборди
SQL - Підзапити та CTE
SQL - Window Functions
BigQuery - Розширені можливості
Data Modeling
Аналіз воронок і конверсії
Аналіз когорт і утримання
Google Tag Manager та трекінг
API та вебхуки
AB Testing та прикладна статистика
Looker Studio (Google Data Studio)
Power BI - Основи
SQL - Розширені аналітичні запити
dbt - Розширені можливості
Power BI - DAX та просунуті дашборди
Python Analytics - Розширений аналіз та ML
Опануй Data Analytics для наступної співбесіди
Отримай доступ до всіх питань, flashcards, технічних тестів, вправ code review та симуляторів співбесід.
Почни безкоштовно