Data Engineering

Monitorowanie i obserwowalność

Strukturyzowane logowanie, metryki, alerting, SLA/SLO/SLI, kontrole jakości danych, Great Expectations, Soda

20 pytań z rozmów·
Senior
1

Czym jest strukturyzowane logowanie w kontekście data pipeline?

Odpowiedź

Strukturyzowane logowanie polega na emitowaniu logów w formacie nadającym się do parsowania (JSON, key-value) zamiast wolnego tekstu. Pozwala to łatwo filtrować, wyszukiwać i agregować logi w narzędziach takich jak Cloud Logging, Elasticsearch lub Datadog. W data pipeline znacznie ułatwia debugowanie, umożliwiając filtrowanie według DAG, task_id, run_id lub dowolnego kontekstu biznesowego.

2

Jaka jest różnica między SLI (Service Level Indicator) a SLO (Service Level Objective)?

Odpowiedź

SLI to mierzalna metryka, która kwantyfikuje aspekt jakości usługi (np. wskaźnik powodzenia zadań, opóźnienie pipeline). SLO to cel zdefiniowany na tej metryce (np. 99,5% zadań musi się powieść). SLA to zobowiązanie umowne wobec klientów oparte na wewnętrznych SLO. Ta hierarchia umożliwia obiektywne monitorowanie niezawodności i wyzwalanie alertów przed naruszeniem SLA.

3

Czym jest Expectation w Great Expectations?

Odpowiedź

Expectation to deklaratywne potwierdzenie dotyczące danych, takie jak expect_column_values_to_not_be_null lub expect_column_values_to_be_between. Great Expectations automatycznie generuje dokumentację i wykonalne wyniki walidacji. Te Expectation są grupowane w Suite, które definiują kompletny kontrakt jakości dla zbioru danych.

4

Jaka jest główna rola Soda w data pipeline?

5

Czym jest runbook w kontekście zarządzania incydentami danych?

+17 pytań z rozmów

Opanuj Data Engineering na następną rozmowę

Uzyskaj dostęp do wszystkich pytań, flashcards, testów technicznych, ćwiczeń code review i symulatorów rozmów.

Zacznij za darmo