Data Engineering

ETL- / ELT- / ETLT-patronen

ETL vs ELT vs ETLT, batch vs micro-batch vs streaming, idempotentie, error handling, dead letter queues, datakwaliteit, lineage

20 gespreksvragen·
Senior
1

Wat is het belangrijkste verschil tussen ETL en ELT?

Antwoord

Bij ETL (Extract-Transform-Load) worden gegevens getransformeerd op een tussenserver voordat ze in de bestemming worden geladen. Bij ELT (Extract-Load-Transform) worden ruwe gegevens eerst in de bestemming geladen (meestal een cloud data warehouse) en vervolgens direct daarin getransformeerd met behulp van de rekenkracht ervan. ELT is populair geworden bij cloud data warehouses zoals BigQuery, Snowflake of Redshift die elastische rekenkracht bieden.

2

Wat is het belangrijkste voordeel van de ELT-aanpak vergeleken met traditionele ETL?

Antwoord

De ELT-aanpak benut de elastische rekenkracht van moderne cloud data warehouses (BigQuery, Snowflake, Redshift). In plaats van een aparte transformatie-infrastructuur te onderhouden die een bottleneck kan worden, gebruiken transformaties direct de scaling-mogelijkheden van het data warehouse. Dit vermindert operationele complexiteit en maakt het verwerken van veel grotere datavolumes mogelijk zonder handmatige resource provisioning.

3

Wat is het ETLT-patroon en wanneer is het relevant?

Antwoord

ETLT combineert beide benaderingen: een eerste lichte transformatie wordt uitgevoerd tijdens de extractie (opschoning, filtering, anonimisering), daarna worden de gegevens geladen en worden complexere transformaties toegepast in het data warehouse. Dit patroon is nuttig wanneer bepaalde transformaties stroomopwaarts moeten worden uitgevoerd om compliance-redenen (maskeren van gevoelige gegevens vóór het laden), volumevermindering (vroeg filteren) of normalisatie van heterogene bronformaten.

4

Wat is idempotentie in de context van datapipelines?

5

Hoe implementeer je idempotentie bij het laden van gegevens in een tabel?

+17 gespreksvragen

Beheers Data Engineering voor je volgende gesprek

Krijg toegang tot alle vragen, flashcards, technische tests, code review-oefeningen en gespreksimulatoren.

Begin gratis