Data Analytics

dbt - Grondbeginselen

dbt-project, models, sources, refs, tests, documentatie, materializations, seeds

20 gespreksvragen·
Mid-Level
1

Wat is dbt (data build tool)?

Antwoord

dbt is een datatransformatietool waarmee analisten en data engineers transformaties in SQL of Python rechtstreeks in het datawarehouse kunnen schrijven. Het volgt de ELT-aanpak (Extract, Load, Transform) waarbij data eerst in het warehouse wordt geladen en vervolgens ter plaatse getransformeerd, in tegenstelling tot traditionele ETL die transformeert vóór het laden. dbt beheert modelafhankelijkheden, tests en documentatie automatisch.

2

Wat is de basisstructuur van een dbt-project?

Antwoord

Een dbt-project is georganiseerd rond belangrijke mappen: models/ bevat SQL-bestanden die transformaties definiëren, seeds/ bevat CSV-bestanden die als tabellen worden geladen, tests/ slaat aangepaste tests op, macros/ heeft herbruikbare Jinja-functies en snapshots/ bewaart toestandsopnames. Het bestand dbt_project.yml in de root configureert het project (naam, versie, standaard materializations), terwijl profiles.yml de warehouse-verbindingen definieert.

3

Wat is een model in dbt?

Antwoord

Een dbt-model is een SQL-bestand met een SELECT-instructie die een datatransformatie definieert. Elk model komt overeen met een .sql-bestand in de map models/ en produceert een tabel of view in het datawarehouse bij uitvoering. Models kunnen verwijzen naar andere models via de ref()-functie, waardoor een afhankelijkheidsgraaf (DAG) ontstaat die dbt in de juiste volgorde uitvoert.

4

Wat is het doel van de ref()-functie in dbt?

5

Wat is een source in dbt en hoe declareer je er een?

+17 gespreksvragen

Beheers Data Analytics voor je volgende gesprek

Krijg toegang tot alle vragen, flashcards, technische tests, code review-oefeningen en gespreksimulatoren.

Begin gratis