Data Engineering

Airflow + dbt - パイプラインオーケストレーション

astronomer-cosmos、DbtDagParser、Airflow内でのdbt run/test、依存関係の管理、エンドツーエンドのモニタリング

20 面接問題·
Senior
1

astronomer-cosmosを使ってdbtをAirflowに統合する主な利点は何ですか?

回答

Astronomer-cosmosはdbtのmodelを自動的に個別のAirflowタスクに変換し、Airflow UIで各modelに対する細かい可視性を提供します。これにより、dbtプロジェクト全体ではなく、各modelレベルでAirflowの機能(リトライ、アラート、モニタリング)を活用できます。

2

cosmosはAirflow DAG内のdbt model間の依存関係をどのように扱いますか?

回答

Cosmosはdbtのmanifest.jsonを解析してmodel間の依存関係グラフを抽出します。次に、対応するAirflowタスク間の依存関係(upstream/downstream)を自動的に作成し、dbtプロジェクトのrefsで定義された実行順序を尊重します。

3

cosmosの'local'モードと'docker'モードの実行の違いは何ですか?

回答

ローカルモードでは、cosmosはAirflowワーカーのPython環境で直接dbtを実行するため、dbtのインストールが必要です。dockerモードでは、各dbtタスクは独自のdbtイメージを持つ独立したDockerコンテナで実行され、より良い分離性と依存関係の再現性を提供します。

4

タグに基づいてdbt modelのサブセットのみを実行するようにcosmosを構成するにはどうすればよいですか?

5

cosmosを使用したAirflow-dbt統合におけるDbtTaskGroupの役割は何ですか?

+17 面接問題

次の面接に向けてData Engineeringをマスター

すべての問題、flashcards、技術テスト、コードレビュー演習、面接シミュレーターにアクセス。

無料で始める