Data Analytics

dbt - Основи

Проєкт dbt, models, sources, refs, tests, документація, materializations, seeds

20 питань зі співбесід·
Mid-Level
1

Що таке dbt (data build tool)?

Відповідь

dbt — це інструмент трансформації даних, який дозволяє аналітикам та інженерам даних писати перетворення на SQL або Python безпосередньо у сховищі даних. Він використовує підхід ELT (Extract, Load, Transform), де дані спочатку завантажуються у сховище, а потім перетворюються на місці, на відміну від традиційного ETL, який перетворює перед завантаженням. dbt автоматично керує залежностями між моделями, тестами та документацією.

2

Яка базова структура проєкту dbt?

Відповідь

Проєкт dbt організований навколо ключових папок: models/ містить SQL-файли, що визначають перетворення, seeds/ зберігає CSV-файли, що завантажуються як таблиці, tests/ зберігає користувацькі тести, macros/ має багаторазові функції Jinja, а snapshots/ зберігає знімки стану. Файл dbt_project.yml у корені налаштовує проєкт (назва, версія, materializations за замовчуванням), тоді як profiles.yml визначає підключення до сховища.

3

Що таке model у dbt?

Відповідь

Model dbt — це SQL-файл, що містить інструкцію SELECT, яка визначає перетворення даних. Кожен model відповідає файлу .sql у папці models/ і створює таблицю або представлення у сховищі даних під час виконання. Models можуть посилатися на інші models через функцію ref(), створюючи граф залежностей (DAG), який dbt виконує у правильному порядку.

4

Яке призначення функції ref() у dbt?

5

Що таке source у dbt та як її оголосити?

+17 питань зі співбесід

Інші теми співбесід Data Analytics

Google Sheets - Основи

Junior
20 запитань

Google Sheets - Розширені формули

Junior
20 запитань

SQL - Основи

Junior
25 запитань

SQL - Агрегації та групування

Junior
20 запитань

SQL - З'єднання

Junior
20 запитань

BigQuery - Основи

Junior
20 запитань

Data Cleaning - Очищення даних

Junior
20 запитань

KPI та бізнес-метрики

Junior
20 запитань

Описова статистика

Junior
20 запитань

Zapier та No-Code автоматизація

Junior
20 запитань

Принципи візуалізації даних

Junior
20 запитань

Python & Pandas - Основи

Junior
20 запитань

Google Sheets - Автоматизовані дашборди

Mid-Level
20 запитань

SQL - Підзапити та CTE

Mid-Level
20 запитань

SQL - Window Functions

Mid-Level
20 запитань

BigQuery - Розширені можливості

Mid-Level
20 запитань

Data Modeling

Mid-Level
20 запитань

Аналіз воронок і конверсії

Mid-Level
20 запитань

Аналіз когорт і утримання

Mid-Level
20 запитань

Google Tag Manager та трекінг

Mid-Level
20 запитань

API та вебхуки

Mid-Level
20 запитань

AB Testing та прикладна статистика

Mid-Level
20 запитань

Looker Studio (Google Data Studio)

Mid-Level
20 запитань

Power BI - Основи

Mid-Level
20 запитань

SQL - Розширені аналітичні запити

Senior
20 запитань

dbt - Розширені можливості

Senior
20 запитань

Power BI - DAX та просунуті дашборди

Senior
20 запитань

Python Analytics - Розширений аналіз та ML

Senior
20 запитань

Опануй Data Analytics для наступної співбесіди

Отримай доступ до всіх питань, flashcards, технічних тестів, вправ code review та симуляторів співбесід.

Почни безкоштовно