Data Engineering

Pattern ETL / ELT / ETLT

ETL vs ELT vs ETLT, batch vs micro-batch vs streaming, idempotenza, gestione degli errori, dead letter queue, qualità dei dati, lineage

20 domande da colloquio·
Senior
1

Qual è la principale differenza tra ETL ed ELT?

Risposta

In ETL (Extract-Transform-Load), i dati vengono trasformati su un server intermedio prima di essere caricati nella destinazione. In ELT (Extract-Load-Transform), i dati grezzi vengono prima caricati nella destinazione (tipicamente un data warehouse cloud), poi trasformati direttamente al suo interno usando la sua potenza di calcolo. ELT è diventato popolare con i data warehouse cloud come BigQuery, Snowflake o Redshift che offrono potenza di calcolo elastica.

2

Qual è il principale vantaggio dell'approccio ELT rispetto all'ETL tradizionale?

Risposta

L'approccio ELT sfrutta la potenza di calcolo elastica dei moderni data warehouse cloud (BigQuery, Snowflake, Redshift). Invece di mantenere un'infrastruttura di trasformazione separata che può diventare un collo di bottiglia, le trasformazioni utilizzano direttamente le capacità di scaling del data warehouse. Ciò riduce la complessità operativa e consente di elaborare volumi di dati molto maggiori senza provisioning manuale delle risorse.

3

Cos'è il pattern ETLT e quando è rilevante?

Risposta

ETLT combina entrambi gli approcci: una prima trasformazione leggera viene eseguita durante l'estrazione (pulizia, filtraggio, anonimizzazione), poi i dati vengono caricati e trasformazioni più complesse vengono applicate nel data warehouse. Questo pattern è utile quando determinate trasformazioni devono essere fatte a monte per motivi di compliance (mascheramento di dati sensibili prima del caricamento), riduzione del volume (filtraggio precoce) o normalizzazione di formati sorgente eterogenei.

4

Cos'è l'idempotenza nel contesto delle data pipeline?

5

Come implementare l'idempotenza durante il caricamento dei dati in una tabella?

+17 domande da colloquio

Padroneggia Data Engineering per il tuo prossimo colloquio

Accedi a tutte le domande, flashcards, test tecnici, esercizi di code review e simulatori di colloquio.

Inizia gratis