
Apache Airflow - 上級
Sensors、XCom、TaskFlow API、pools、priority、dynamic DAGs、KubernetesPodOperator、monitoring
20 面接問題·
Senior
1Apache AirflowにおけるSensorの主な役割は何ですか?
1
Apache AirflowにおけるSensorの主な役割は何ですか?
回答
Sensorは、DAG実行を続行する前に条件が満たされるのを待つ特別なオペレーターです。ファイルの到着、パーティションの利用可能性、別のタスクの状態など、条件が満たされているかを定期的に確認(poke)します。Sensorsは外部イベントに依存するワークフローのオーケストレーションに不可欠です。
2Sensorの'poke'モードと'reschedule'モードの違いは何ですか?
2
Sensorの'poke'モードと'reschedule'モードの違いは何ですか?
回答
pokeモードでは、Sensorはworker slotを継続的に占有し、定期的な間隔(poke_interval)で条件を確認します。rescheduleモードでは、Sensorは各確認の間にworker slotを解放し、自身を再スケジュールします。rescheduleモードは長時間かかる条件に推奨され、他のタスクのためにリソースを解放します。
3Hiveパーティションが利用可能になるのを待つために、どのSensorを使用すべきですか?
3
Hiveパーティションが利用可能になるのを待つために、どのSensorを使用すべきですか?
回答
HivePartitionSensorは、Hiveテーブル内の特定のパーティションの存在を確認します。データパイプラインで変換を実行する前にソースデータが利用可能であることを確認するために一般的に使用されます。schema、table、partitionなどのパラメーターを受け入れます。
4
2つのAirflowタスク間でデータを渡す方法は?
5
XComに保存されるデータの推奨最大サイズはどれくらいですか?
+17 面接問題
その他のData Engineering面接トピック
Linux & Shell - 基礎
Junior
20問Git & GitHub - 基礎
Junior
20問データエンジニアリングのための高度なPython
Junior
25問Docker - 基礎
Junior
25問Google Cloud Platform - 基礎
Junior
20問CI/CDとコード品質
Mid-Level
20問Docker Compose
Mid-Level
20問FastAPI - データAPI
Mid-Level
20問Data Engineering向けの高度なSQL
Mid-Level
20問Data Lake - アーキテクチャと取り込み
Mid-Level
20問データエンジニアリングのためのBigQuery
Mid-Level
20問PostgreSQL - 管理
Mid-Level
20問Data EngineeringのためのData Modeling
Mid-Level
20問Fivetran & Airbyte - データ取り込み
Mid-Level
20問dbt - 基礎
Mid-Level
20問Apache Airflow - 基礎
Mid-Level
20問Kubernetes - 基礎
Mid-Level
20問dbt - 高度な機能
Senior
20問ETL / ELT / ETLT パターン
Senior
20問Airflow + dbt - パイプラインオーケストレーション
Senior
20問PySpark - 大規模処理
Senior
20問Google Pub/Sub - データストリーミング
Senior
20問Apache Beam & Dataflow
Senior
20問Kubernetes - 本番環境とスケーリング
Senior
20問Terraform - Infrastructure as Code
Senior
20問NoSQLデータベース
Senior
20問モダンなData Architecture
Senior
20問モニタリングとオブザーバビリティ
Senior
20問IAMとデータセキュリティ
Senior
20問