Data Engineering

Moderne Data Architecture

Data Lake vs Data Warehouse vs Lakehouse, Data Mesh, Data Contracts, schema registry, ADR, governance, data catalog, lineage

20 gespreksvragen·
Senior
1

Wat is het fundamentele verschil tussen een Data Lake en een Data Warehouse?

Antwoord

Een Data Lake slaat data op in zijn native (ruwe) formaat met schema toegepast bij het lezen (schema-on-read), wat grote flexibiliteit voor exploratie biedt. Een Data Warehouse dwingt een gestructureerd schema af bij het schrijven (schema-on-write) met getransformeerde en voor analytics geoptimaliseerde data. Data Lakes geven prioriteit aan flexibiliteit en massieve goedkope opslag, terwijl Data Warehouses prioriteit geven aan query-prestaties en datakwaliteit.

2

Wat is het belangrijkste voordeel van Lakehouse-architectuur ten opzichte van gescheiden Data Lake- en Data Warehouse-architecturen?

Antwoord

De Lakehouse-architectuur combineert het beste van twee werelden: de flexibele en kosteneffectieve opslag van Data Lake met de ACID-mogelijkheden, query-prestaties en governance van Data Warehouse. Dit elimineert dataduplicatie tussen systemen, vermindert synchronisatiekosten en complexiteit, terwijl BI- en ML-workloads op hetzelfde platform mogelijk worden gemaakt met open formaten zoals Delta Lake, Iceberg of Hudi.

3

Welk open tabelformaat maakt ACID-transacties op een Data Lake mogelijk?

Antwoord

Delta Lake, Apache Iceberg en Apache Hudi zijn de drie belangrijkste open tabelformaten die ACID-transacties op een Data Lake mogelijk maken. Delta Lake, ontwikkeld door Databricks, gebruikt een transaction log om atomiciteit en consistentie te garanderen. Iceberg, gemaakt door Netflix, biedt geavanceerd partitiebeheer en schema evolution. Hudi, ontwikkeld door Uber, blinkt uit in upsert- en CDC-scenario's. Deze formaten transformeren eenvoudige object storage in een Lakehouse met transactionele garanties.

4

Wat is het fundamentele principe van Data Mesh?

5

Wat is een Data Contract in de context van Data Mesh?

+17 gespreksvragen

Beheers Data Engineering voor je volgende gesprek

Krijg toegang tot alle vragen, flashcards, technische tests, code review-oefeningen en gespreksimulatoren.

Begin gratis