Data Engineering

Monitoramento e observabilidade

Logging estruturado, métricas, alerting, SLA/SLO/SLI, data quality checks, Great Expectations, Soda

20 perguntas de entrevista·
Senior
1

O que é logging estruturado no contexto de um pipeline de dados?

Resposta

Logging estruturado significa emitir logs em um formato parseável (JSON, key-value) em vez de texto livre. Isso permite filtrar, pesquisar e agregar facilmente os logs em ferramentas como Cloud Logging, Elasticsearch ou Datadog. Em um pipeline de dados, isso facilita muito o debugging ao permitir filtrar por DAG, task_id, run_id ou qualquer contexto de negócio.

2

Qual é a diferença entre um SLI (Service Level Indicator) e um SLO (Service Level Objective)?

Resposta

Um SLI é uma métrica mensurável que quantifica um aspecto da qualidade do serviço (ex: taxa de sucesso de jobs, latência do pipeline). Um SLO é um alvo definido sobre essa métrica (ex: 99.5% dos jobs devem ter sucesso). O SLA é o compromisso contratual com os clientes baseado nos SLOs internos. Essa hierarquia permite monitorar objetivamente a confiabilidade e disparar alertas antes de violar os SLAs.

3

O que é uma Expectation em Great Expectations?

Resposta

Uma Expectation é uma asserção declarativa sobre os dados, como expect_column_values_to_not_be_null ou expect_column_values_to_be_between. Great Expectations gera automaticamente documentação e resultados de validação acionáveis. Essas Expectations são agrupadas em Suites que definem o contrato de qualidade completo de um dataset.

4

Qual é o papel principal de Soda em um pipeline de dados?

5

O que é um runbook no contexto da gestão de incidentes de dados?

+17 perguntas de entrevista

Domine Data Engineering para sua proxima entrevista

Acesse todas as perguntas, flashcards, testes tecnicos, exercicios de code review e simuladores de entrevista.

Comece gratis