Data Engineering

Airflow + dbt - Orquestração de pipelines

astronomer-cosmos, DbtDagParser, dbt run/test no Airflow, gerenciamento de dependências, monitoramento end-to-end

20 perguntas de entrevista·
Senior
1

Qual é a principal vantagem de usar astronomer-cosmos para integrar dbt no Airflow?

Resposta

O astronomer-cosmos converte automaticamente models dbt em tarefas Airflow individuais, oferecendo visibilidade granular de cada model na UI do Airflow. Isso permite aproveitar os recursos do Airflow (retry, alerting, monitoring) no nível de cada model em vez de todo o projeto dbt.

2

Como o cosmos gerencia as dependências entre models dbt em um DAG Airflow?

Resposta

O cosmos analisa o manifest.json do dbt para extrair o grafo de dependências entre models. Em seguida, cria automaticamente as relações de dependência (upstream/downstream) entre as tarefas Airflow correspondentes, respeitando assim a ordem de execução definida pelas refs no projeto dbt.

3

Qual é a diferença entre os modos de execução 'local' e 'docker' no cosmos?

Resposta

No modo local, o cosmos executa dbt diretamente no ambiente Python do worker Airflow, exigindo que dbt esteja instalado. No modo docker, cada tarefa dbt é executada em um contêiner Docker isolado com sua própria imagem dbt, oferecendo melhor isolamento e reprodutibilidade de dependências.

4

Como configurar o cosmos para executar apenas um subconjunto de models dbt baseado em tags?

5

Qual é o papel do DbtTaskGroup na integração Airflow-dbt com cosmos?

+17 perguntas de entrevista

Domine Data Engineering para sua proxima entrevista

Acesse todas as perguntas, flashcards, testes tecnicos, exercicios de code review e simuladores de entrevista.

Comece gratis