Data Engineering

Data Architecture moderna

Data Lake vs Data Warehouse vs Lakehouse, Data Mesh, Data Contracts, schema registry, ADR, governance, data catalog, lineage

20 domande da colloquio·
Senior
1

Qual è la differenza fondamentale tra un Data Lake e un Data Warehouse?

Risposta

Un Data Lake memorizza i dati nel loro formato nativo (grezzo) con uno schema applicato in lettura (schema-on-read), consentendo grande flessibilità per l'esplorazione. Un Data Warehouse impone uno schema strutturato in scrittura (schema-on-write) con dati trasformati e ottimizzati per l'analytics. I Data Lake privilegiano flessibilità e storage massivo a basso costo, mentre i Data Warehouse privilegiano la performance delle query analitiche e la qualità dei dati.

2

Qual è il principale vantaggio dell'architettura Lakehouse rispetto ad architetture Data Lake e Data Warehouse separate?

Risposta

L'architettura Lakehouse combina il meglio di entrambi i mondi: lo storage flessibile ed economico del Data Lake con le capacità ACID, le performance delle query e la governance del Data Warehouse. Questo elimina la duplicazione dei dati tra i sistemi, riduce costi e complessità di sincronizzazione, consentendo workload BI e ML sulla stessa piattaforma utilizzando formati aperti come Delta Lake, Iceberg o Hudi.

3

Quale formato di tabella aperto consente transazioni ACID su un Data Lake?

Risposta

Delta Lake, Apache Iceberg e Apache Hudi sono i tre principali formati di tabella aperti che abilitano transazioni ACID su un Data Lake. Delta Lake, sviluppato da Databricks, usa un transaction log per garantire atomicità e coerenza. Iceberg, creato da Netflix, offre gestione avanzata delle partizioni e schema evolution. Hudi, sviluppato da Uber, eccelle in scenari di upsert e CDC. Questi formati trasformano un semplice storage di oggetti in un Lakehouse con garanzie transazionali.

4

Qual è il principio fondamentale del Data Mesh?

5

Cos'è un Data Contract nel contesto del Data Mesh?

+17 domande da colloquio

Padroneggia Data Engineering per il tuo prossimo colloquio

Accedi a tutte le domande, flashcards, test tecnici, esercizi di code review e simulatori di colloquio.

Inizia gratis