Data Engineering

Airflow + dbt - Orchestrazione delle pipeline

astronomer-cosmos, DbtDagParser, dbt run/test in Airflow, gestione delle dipendenze, monitoraggio end-to-end

20 domande da colloquio·
Senior
1

Qual è il vantaggio principale dell'utilizzo di astronomer-cosmos per integrare dbt in Airflow?

Risposta

Astronomer-cosmos converte automaticamente i model dbt in task Airflow individuali, fornendo visibilità granulare su ciascun model nell'interfaccia Airflow. Questo permette di sfruttare le funzionalità di Airflow (retry, alerting, monitoring) a livello di model piuttosto che sull'intero progetto dbt.

2

Come gestisce cosmos le dipendenze tra i model dbt in un DAG Airflow?

Risposta

Cosmos analizza il manifest.json di dbt per estrarre il grafo delle dipendenze tra i model. Quindi crea automaticamente le relazioni di dipendenza (upstream/downstream) tra i task Airflow corrispondenti, rispettando così l'ordine di esecuzione definito dai refs nel progetto dbt.

3

Qual è la differenza tra le modalità di esecuzione 'local' e 'docker' in cosmos?

Risposta

In modalità local, cosmos esegue dbt direttamente nell'ambiente Python del worker Airflow, richiedendo che dbt sia installato. In modalità docker, ogni task dbt viene eseguito in un container Docker isolato con la propria immagine dbt, offrendo migliore isolamento e riproducibilità delle dipendenze.

4

Come configurare cosmos per eseguire solo un sottoinsieme di model dbt basato sui tag?

5

Qual è il ruolo di DbtTaskGroup nell'integrazione Airflow-dbt con cosmos?

+17 domande da colloquio

Padroneggia Data Engineering per il tuo prossimo colloquio

Accedi a tutte le domande, flashcards, test tecnici, esercizi di code review e simulatori di colloquio.

Inizia gratis