
dbt - Grondbeginselen
dbt-project, models, sources, refs, tests, documentatie, materializations, seeds
1Wat is dbt (data build tool)?
Wat is dbt (data build tool)?
Antwoord
dbt is een datatransformatietool waarmee analisten en data engineers transformaties in SQL of Python rechtstreeks in het datawarehouse kunnen schrijven. Het volgt de ELT-aanpak (Extract, Load, Transform) waarbij data eerst in het warehouse wordt geladen en vervolgens ter plaatse getransformeerd, in tegenstelling tot traditionele ETL die transformeert vóór het laden. dbt beheert modelafhankelijkheden, tests en documentatie automatisch.
2Wat is de basisstructuur van een dbt-project?
Wat is de basisstructuur van een dbt-project?
Antwoord
Een dbt-project is georganiseerd rond belangrijke mappen: models/ bevat SQL-bestanden die transformaties definiëren, seeds/ bevat CSV-bestanden die als tabellen worden geladen, tests/ slaat aangepaste tests op, macros/ heeft herbruikbare Jinja-functies en snapshots/ bewaart toestandsopnames. Het bestand dbt_project.yml in de root configureert het project (naam, versie, standaard materializations), terwijl profiles.yml de warehouse-verbindingen definieert.
3Wat is een model in dbt?
Wat is een model in dbt?
Antwoord
Een dbt-model is een SQL-bestand met een SELECT-instructie die een datatransformatie definieert. Elk model komt overeen met een .sql-bestand in de map models/ en produceert een tabel of view in het datawarehouse bij uitvoering. Models kunnen verwijzen naar andere models via de ref()-functie, waardoor een afhankelijkheidsgraaf (DAG) ontstaat die dbt in de juiste volgorde uitvoert.
Wat is het doel van de ref()-functie in dbt?
Wat is een source in dbt en hoe declareer je er een?
+17 gespreksvragen
Andere Data Analytics-sollicitatieonderwerpen
Google Sheets - Grondbeginselen
Google Sheets - Geavanceerde formules
SQL - Grondbeginselen
SQL - Aggregaties en groeperingen
SQL - Joins
BigQuery - Grondbeginselen
Data Cleaning - Data opschonen
KPI's en business-metrieken
Beschrijvende statistiek
Zapier en No-Code automatisering
Principes van datavisualisatie
Python & Pandas - Grondbeginselen
Google Sheets - Geautomatiseerde dashboards
SQL - Subquery's en CTE's
SQL - Window Functions
BigQuery - Geavanceerde functies
Data Modeling
Funnel- en conversieanalyse
Cohort- en retentieanalyse
Google Tag Manager en tracking
API's en webhooks
AB Testing en toegepaste statistiek
Looker Studio (Google Data Studio)
Power BI - Basisprincipes
SQL - Geavanceerde analytische queries
dbt - Geavanceerde functies
Power BI - DAX en geavanceerde dashboards
Python Analytics - Geavanceerde analyse en ML
Beheers Data Analytics voor je volgende gesprek
Krijg toegang tot alle vragen, flashcards, technische tests, code review-oefeningen en gespreksimulatoren.
Begin gratis