Data Engineering

dbt - Grondbeginselen

dbt-project, models, sources, refs, tests, documentatie, materializations (table, view, incremental), seeds

20 gespreksvragen·
Mid-Level
1

Wat is dbt (data build tool)?

Antwoord

dbt is een data-transformatietool waarmee transformaties in SQL geschreven en in een data warehouse uitgevoerd kunnen worden. Het past software-engineering principes (versiebeheer, tests, documentatie) toe op het transformeren van data. dbt verzorgt geen extractie of laden (de E en L van ELT), alleen de transformatie.

2

Wat is de basisstructuur van een dbt-project?

Antwoord

Een dbt-project bevat een dbt_project.yml-bestand in de root dat de projectconfiguratie definieert. De belangrijkste mappen zijn models (met SQL-bestanden), tests voor aangepaste tests, macros voor Jinja-macro's, seeds voor CSV-bestanden, en snapshots voor historische data-captures. Het profiles.yml-bestand (meestal buiten het project) definieert de verbindingen met warehouses.

3

Wat is de rol van het profiles.yml-bestand in dbt?

Antwoord

Het profiles.yml-bestand bevat verbindingsinformatie naar data warehouses (BigQuery, Snowflake, Redshift, PostgreSQL, enz.). Het wordt meestal opgeslagen in de ~/.dbt/-map en niet in het project om het versiebeheer van gevoelige credentials te vermijden. Elk profiel kan meerdere targets (dev, prod) hebben, waardoor eenvoudig kan worden geschakeld tussen omgevingen.

4

Wat is een model in dbt?

5

Wat is de rol van de ref()-functie in dbt?

+17 gespreksvragen

Beheers Data Engineering voor je volgende gesprek

Krijg toegang tot alle vragen, flashcards, technische tests, code review-oefeningen en gespreksimulatoren.

Begin gratis