Data Engineering

Apache Airflow - İleri Seviye

Sensors, XCom, TaskFlow API, pools, priority, dynamic DAGs, KubernetesPodOperator, monitoring

20 mülakat soruları·
Senior
1

Apache Airflow'da bir Sensor'ün ana rolü nedir?

Cevap

Sensor, DAG yürütmesine devam etmeden önce bir koşulun karşılanmasını bekleyen özel bir operatördür. Dosya gelişi, partition kullanılabilirliği veya başka bir task'in durumu gibi koşulun karşılanıp karşılanmadığını periyodik olarak kontrol eder (poke). Sensors, dış olaylara bağlı workflow'ları orkestre etmek için gereklidir.

2

Bir Sensor için 'poke' ve 'reschedule' modları arasındaki fark nedir?

Cevap

poke modunda, Sensor sürekli olarak bir worker slot'unu işgal eder ve düzenli aralıklarla (poke_interval) koşulu kontrol eder. reschedule modunda, Sensor kontroller arasında worker slot'unu serbest bırakır ve kendini yeniden zamanlar. reschedule modu, diğer task'ler için kaynakları serbest bıraktığı için uzun süreli koşullar için önerilir.

3

Bir Hive partition'ının kullanılabilir olmasını beklemek için hangi Sensor kullanılmalıdır?

Cevap

HivePartitionSensor, bir Hive tablosundaki belirli bir partition'ın varlığını kontrol eder. Dönüşümleri çalıştırmadan önce kaynak verilerin kullanılabilir olduğundan emin olmak için veri pipeline'larında yaygın olarak kullanılır. schema, table ve partition gibi parametreleri kabul eder.

4

İki Airflow task'i arasında veri nasıl aktarılır?

5

XCom'da depolanan veriler için önerilen maksimum boyut nedir?

+17 mülakat soruları

Bir sonraki mülakatın için Data Engineering'de uzmanlaş

Tüm sorulara, flashcards'a, teknik testlere, code review alıştırmalarına ve mülakat simülatörlerine eriş.

Ücretsiz başla