Data Engineering

Padrões ETL / ELT / ETLT

ETL vs ELT vs ETLT, batch vs micro-batch vs streaming, idempotência, tratamento de erros, dead letter queues, qualidade de dados, lineage

20 perguntas de entrevista·
Senior
1

Qual é a principal diferença entre ETL e ELT?

Resposta

No ETL (Extract-Transform-Load), os dados são transformados em um servidor intermediário antes de serem carregados no destino. No ELT (Extract-Load-Transform), os dados brutos são primeiro carregados no destino (geralmente um data warehouse cloud) e depois transformados diretamente nele usando seu poder de processamento. ELT tornou-se popular com data warehouses cloud como BigQuery, Snowflake ou Redshift que oferecem poder de processamento elástico.

2

Qual é a principal vantagem da abordagem ELT em comparação ao ETL tradicional?

Resposta

A abordagem ELT aproveita o poder de processamento elástico dos data warehouses cloud modernos (BigQuery, Snowflake, Redshift). Em vez de manter uma infraestrutura de transformação separada que pode se tornar um gargalo, as transformações usam diretamente as capacidades de scaling do data warehouse. Isso reduz a complexidade operacional e permite processar volumes de dados muito maiores sem provisionamento manual de recursos.

3

O que é o padrão ETLT e quando é relevante?

Resposta

ETLT combina ambas as abordagens: uma primeira transformação leve é realizada durante a extração (limpeza, filtragem, anonimização), em seguida os dados são carregados e transformações mais complexas são aplicadas no data warehouse. Este padrão é útil quando certas transformações devem ser feitas a montante por razões de compliance (mascaramento de dados sensíveis antes do carregamento), redução de volume (filtragem antecipada) ou normalização de formatos de origem heterogêneos.

4

O que é idempotência no contexto de pipelines de dados?

5

Como implementar a idempotência ao carregar dados em uma tabela?

+17 perguntas de entrevista

Domine Data Engineering para sua proxima entrevista

Acesse todas as perguntas, flashcards, testes tecnicos, exercicios de code review e simuladores de entrevista.

Comece gratis