Data Engineering

Monitoring en observability

Structured logging, metrics, alerting, SLA/SLO/SLI, data quality checks, Great Expectations, Soda

20 gespreksvragen·
Senior
1

Wat is structured logging in de context van een data pipeline?

Antwoord

Structured logging betekent het uitsturen van logs in een parseerbaar formaat (JSON, key-value) in plaats van vrije tekst. Dit maakt het eenvoudig om logs te filteren, doorzoeken en aggregeren in tools zoals Cloud Logging, Elasticsearch of Datadog. In een data pipeline vergemakkelijkt dit het debuggen aanzienlijk door filtering op DAG, task_id, run_id of elke bedrijfscontext mogelijk te maken.

2

Wat is het verschil tussen een SLI (Service Level Indicator) en een SLO (Service Level Objective)?

Antwoord

Een SLI is een meetbare metric die een aspect van servicekwaliteit kwantificeert (bijv. job-succespercentage, pipeline-latency). Een SLO is een doel gedefinieerd op die metric (bijv. 99,5% van de jobs moet slagen). De SLA is de contractuele verbintenis aan klanten gebaseerd op interne SLO's. Deze hiërarchie maakt objectieve betrouwbaarheidsmonitoring mogelijk en het triggeren van alerts voordat SLA's worden geschonden.

3

Wat is een Expectation in Great Expectations?

Antwoord

Een Expectation is een declaratieve assertie over data, zoals expect_column_values_to_not_be_null of expect_column_values_to_be_between. Great Expectations genereert automatisch documentatie en actiebare validatieresultaten. Deze Expectations worden gegroepeerd in Suites die het complete kwaliteitscontract van een dataset definiëren.

4

Wat is de hoofdrol van Soda in een data pipeline?

5

Wat is een runbook in de context van data-incidentbeheer?

+17 gespreksvragen

Beheers Data Engineering voor je volgende gesprek

Krijg toegang tot alle vragen, flashcards, technische tests, code review-oefeningen en gespreksimulatoren.

Begin gratis