Data Engineering

İzleme ve Gözlemlenebilirlik

Yapılandırılmış loglama, metrikler, alerting, SLA/SLO/SLI, veri kalite kontrolleri, Great Expectations, Soda

20 mülakat soruları·
Senior
1

Veri pipeline'ı bağlamında yapılandırılmış loglama nedir?

Cevap

Yapılandırılmış loglama, logları serbest metin yerine ayrıştırılabilir bir formatta (JSON, key-value) yaymak anlamına gelir. Bu, Cloud Logging, Elasticsearch veya Datadog gibi araçlarda logları kolayca filtrelemeyi, aramayı ve toplamayı sağlar. Bir veri pipeline'ında, DAG, task_id, run_id veya herhangi bir iş bağlamı ile filtrelemeye olanak tanıyarak debugging'i büyük ölçüde kolaylaştırır.

2

SLI (Service Level Indicator) ile SLO (Service Level Objective) arasındaki fark nedir?

Cevap

SLI, hizmet kalitesinin bir yönünü ölçen (ör. iş başarı oranı, pipeline gecikmesi) ölçülebilir bir metriktir. SLO, bu metrik üzerinde tanımlanan bir hedeftir (ör. işlerin %99,5'i başarılı olmalı). SLA, dahili SLO'lara dayalı müşterilere yönelik sözleşmeye dayalı taahhüttür. Bu hiyerarşi, güvenilirliği nesnel olarak izlemeyi ve SLA'ları ihlal etmeden önce alert tetiklemeyi sağlar.

3

Great Expectations'ta Expectation nedir?

Cevap

Expectation, expect_column_values_to_not_be_null veya expect_column_values_to_be_between gibi veriler hakkında bildirimsel bir iddiadır. Great Expectations otomatik olarak belgeleri ve uygulanabilir doğrulama sonuçları üretir. Bu Expectation'lar, bir veri kümesinin tam kalite sözleşmesini tanımlayan Suite'lere gruplandırılır.

4

Veri pipeline'ında Soda'nın ana rolü nedir?

5

Veri olay yönetimi bağlamında runbook nedir?

+17 mülakat soruları

Bir sonraki mülakatın için Data Engineering'de uzmanlaş

Tüm sorulara, flashcards'a, teknik testlere, code review alıştırmalarına ve mülakat simülatörlerine eriş.

Ücretsiz başla