
Apache Airflow - 基礎
DAG、operator(Bash、Python、SQL)、スケジューリング、タスクの依存関係、Airflow UI、connection、variable、trigger rule
20 面接問題·
Mid-Level
1Apache AirflowにおけるDAGとは何ですか?
1
Apache AirflowにおけるDAGとは何ですか?
回答
DAG(Directed Acyclic Graph)は、依存関係とリレーションシップで構成されたタスクのコレクションで、完全なワークフローを表します。非循環的な性質とは、依存関係グラフにループがあってはならないことを意味し、各タスクが実行ごとに正確に1回実行されることを保証します。DAGはタスクをいつどのように実行するかを定義しますが、具体的に何をするかは定義しません。
2Schedulerが実行のスケジューリングを開始する日付を定義するDAGパラメータはどれですか?
2
Schedulerが実行のスケジューリングを開始する日付を定義するDAGパラメータはどれですか?
回答
start_dateパラメータは、AirflowがDAGの実行のスケジューリングを開始する日付を定義します。この日付はschedule_intervalと組み合わせて使用され、data intervalを決定します。重要な点:start_dateが過去の場合、catchup=Falseが設定されていない限り、Airflowは見逃した実行を取り戻すためにbackfillをトリガーする可能性があります。
3Airflow DAGでPython関数を実行するにはどのoperatorを使用すべきですか?
3
Airflow DAGでPython関数を実行するにはどのoperatorを使用すべきですか?
回答
PythonOperatorを使用すると、Airflow DAGでPython callable関数を実行できます。関数はpython_callableパラメータを介して渡され、op_args(リスト)またはop_kwargs(辞書)を介して引数を受け取ることができます。PythonOperatorは、カスタムPythonコードを実行するための高い柔軟性を提供するため、最も一般的に使用されるoperatorの1つです。
4
task_bがtask_aの後に実行されるように、2つのタスクtask_aとtask_b間の依存関係を定義する方法は?
5
毎日深夜0時の実行を表すcron式はどれですか?
+17 面接問題
その他のData Engineering面接トピック
Linux & Shell - 基礎
Junior
20問Git & GitHub - 基礎
Junior
20問データエンジニアリングのための高度なPython
Junior
25問Docker - 基礎
Junior
25問Google Cloud Platform - 基礎
Junior
20問CI/CDとコード品質
Mid-Level
20問Docker Compose
Mid-Level
20問FastAPI - データAPI
Mid-Level
20問Data Engineering向けの高度なSQL
Mid-Level
20問Data Lake - アーキテクチャと取り込み
Mid-Level
20問データエンジニアリングのためのBigQuery
Mid-Level
20問PostgreSQL - 管理
Mid-Level
20問Data EngineeringのためのData Modeling
Mid-Level
20問Fivetran & Airbyte - データ取り込み
Mid-Level
20問dbt - 基礎
Mid-Level
20問Kubernetes - 基礎
Mid-Level
20問dbt - 高度な機能
Senior
20問ETL / ELT / ETLT パターン
Senior
20問Apache Airflow - 上級
Senior
20問Airflow + dbt - パイプラインオーケストレーション
Senior
20問PySpark - 大規模処理
Senior
20問Google Pub/Sub - データストリーミング
Senior
20問Apache Beam & Dataflow
Senior
20問Kubernetes - 本番環境とスケーリング
Senior
20問Terraform - Infrastructure as Code
Senior
20問NoSQLデータベース
Senior
20問モダンなData Architecture
Senior
20問モニタリングとオブザーバビリティ
Senior
20問IAMとデータセキュリティ
Senior
20問