Question 1

Czym jest dbt (data build tool)?

Accepted Answer

dbt to narzędzie do transformacji danych, które pozwala analitykom i inżynierom danych pisać transformacje w SQL lub Pythonie bezpośrednio w hurtowni danych. Stosuje podejście ELT (Extract, Load, Transform), w którym dane są najpierw ładowane do hurtowni, a następnie transformowane na miejscu, w przeciwieństwie do klasycznego ETL, który transformuje przed załadowaniem. dbt automatycznie zarządza zależnościami między modelami, testami i dokumentacją.

Question 2

Jaka jest podstawowa struktura projektu dbt?

Accepted Answer

Projekt dbt jest zorganizowany wokół kluczowych folderów: models/ zawiera pliki SQL definiujące transformacje, seeds/ przechowuje pliki CSV ładowane jako tabele, tests/ przechowuje niestandardowe testy, macros/ zawiera funkcje Jinja wielokrotnego użytku, a snapshots/ przechowuje migawki stanu. Plik dbt_project.yml w katalogu głównym konfiguruje projekt (nazwa, wersja, domyślne materializations), podczas gdy profiles.yml definiuje połączenia z hurtownią.

Question 3

Czym jest model w dbt?

Accepted Answer

Model dbt to plik SQL zawierający instrukcję SELECT, która definiuje transformację danych. Każdy model odpowiada plikowi .sql w folderze models/ i podczas wykonywania tworzy tabelę lub widok w hurtowni danych. Modele mogą odwoływać się do innych modeli za pomocą funkcji ref(), tworząc graf zależności (DAG), który dbt wykonuje we właściwej kolejności.

dbt - Podstawy

Czym jest dbt (data build tool)?

Odpowiedź

Jaka jest podstawowa struktura projektu dbt?

Odpowiedź

Czym jest model w dbt?

Odpowiedź

Jaki jest cel funkcji ref() w dbt?

Czym jest source w dbt i jak ją zadeklarować?

Inne tematy rekrutacyjne Data Analytics

Google Sheets - Podstawy

Google Sheets - Zaawansowane formuły

SQL - Podstawy

SQL - Agregacje i grupowanie

SQL - Złączenia

BigQuery - Podstawy

Data Cleaning - Czyszczenie danych

KPI i metryki biznesowe

Statystyka opisowa

Zapier i automatyzacja No-Code

Zasady wizualizacji danych

Python & Pandas - Podstawy

Google Sheets - Automatyczne dashboardy

SQL - Podzapytania i CTE

SQL - Window Functions

BigQuery - Funkcje zaawansowane

Data Modeling

Analiza funneli i konwersji

Analiza kohort i retencji

Google Tag Manager i tracking

API i webhooki

AB Testing i statystyka stosowana

Looker Studio (Google Data Studio)

Power BI - Podstawy

SQL - Zaawansowane zapytania analityczne

dbt - Funkcje zaawansowane

Power BI - DAX i zaawansowane dashboardy

Python Analytics - Zaawansowana analiza i ML

Opanuj Data Analytics na następną rozmowę