
dbt - Podstawy
Projekt dbt, models, sources, refs, tests, dokumentacja, materializations, seeds
1Czym jest dbt (data build tool)?
Czym jest dbt (data build tool)?
Odpowiedź
dbt to narzędzie do transformacji danych, które pozwala analitykom i inżynierom danych pisać transformacje w SQL lub Pythonie bezpośrednio w hurtowni danych. Stosuje podejście ELT (Extract, Load, Transform), w którym dane są najpierw ładowane do hurtowni, a następnie transformowane na miejscu, w przeciwieństwie do klasycznego ETL, który transformuje przed załadowaniem. dbt automatycznie zarządza zależnościami między modelami, testami i dokumentacją.
2Jaka jest podstawowa struktura projektu dbt?
Jaka jest podstawowa struktura projektu dbt?
Odpowiedź
Projekt dbt jest zorganizowany wokół kluczowych folderów: models/ zawiera pliki SQL definiujące transformacje, seeds/ przechowuje pliki CSV ładowane jako tabele, tests/ przechowuje niestandardowe testy, macros/ zawiera funkcje Jinja wielokrotnego użytku, a snapshots/ przechowuje migawki stanu. Plik dbt_project.yml w katalogu głównym konfiguruje projekt (nazwa, wersja, domyślne materializations), podczas gdy profiles.yml definiuje połączenia z hurtownią.
3Czym jest model w dbt?
Czym jest model w dbt?
Odpowiedź
Model dbt to plik SQL zawierający instrukcję SELECT, która definiuje transformację danych. Każdy model odpowiada plikowi .sql w folderze models/ i podczas wykonywania tworzy tabelę lub widok w hurtowni danych. Modele mogą odwoływać się do innych modeli za pomocą funkcji ref(), tworząc graf zależności (DAG), który dbt wykonuje we właściwej kolejności.
Jaki jest cel funkcji ref() w dbt?
Czym jest source w dbt i jak ją zadeklarować?
+17 pytań z rozmów
Inne tematy rekrutacyjne Data Analytics
Google Sheets - Podstawy
Google Sheets - Zaawansowane formuły
SQL - Podstawy
SQL - Agregacje i grupowanie
SQL - Złączenia
BigQuery - Podstawy
Data Cleaning - Czyszczenie danych
KPI i metryki biznesowe
Statystyka opisowa
Zapier i automatyzacja No-Code
Zasady wizualizacji danych
Python & Pandas - Podstawy
Google Sheets - Automatyczne dashboardy
SQL - Podzapytania i CTE
SQL - Window Functions
BigQuery - Funkcje zaawansowane
Data Modeling
Analiza funneli i konwersji
Analiza kohort i retencji
Google Tag Manager i tracking
API i webhooki
AB Testing i statystyka stosowana
Looker Studio (Google Data Studio)
Power BI - Podstawy
SQL - Zaawansowane zapytania analityczne
dbt - Funkcje zaawansowane
Power BI - DAX i zaawansowane dashboardy
Python Analytics - Zaawansowana analiza i ML
Opanuj Data Analytics na następną rozmowę
Uzyskaj dostęp do wszystkich pytań, flashcards, testów technicznych, ćwiczeń code review i symulatorów rozmów.
Zacznij za darmo