Question 1

O que é um runbook no contexto DevOps?

Accepted Answer

Um runbook é um documento operacional que contém procedimentos padronizados para lidar com incidentes ou tarefas de manutenção recorrentes. Permite que as equipes on-call sigam etapas predefinidas e validadas para resolver rapidamente problemas conhecidos, reduzindo assim o tempo de resolução e os erros humanos. Os runbooks podem ser manuais ou automatizados e constituem um elemento fundamental da gestão de incidentes.

Question 2

O que é paging no contexto da gestão de incidentes?

Accepted Answer

Paging é o mecanismo de alerta que notifica engenheiros on-call quando ocorre um incidente crítico. Este sistema utiliza diversos canais de comunicação como SMS, chamadas telefônicas ou aplicações dedicadas para garantir que a pessoa responsável seja alertada rapidamente, mesmo fora do horário de trabalho. Um bom sistema de paging inclui políticas de escalation automática se a primeira pessoa não responder.

Question 3

O que é um postmortem no contexto da gestão de incidentes?

Accepted Answer

Um postmortem é uma análise retrospectiva realizada após um incidente significativo. Seu objetivo é entender as causas raiz do incidente, documentar a linha do tempo dos eventos, identificar ações corretivas e compartilhar os aprendizados com a equipe. Um postmortem eficaz adota uma abordagem blameless, focada em melhorar sistemas e processos em vez de responsabilidade individual.

Alerting e Incident Response

O que é um runbook no contexto DevOps?

Resposta

O que é paging no contexto da gestão de incidentes?

Resposta

O que é um postmortem no contexto da gestão de incidentes?

Resposta

Qual é a diferença entre um event e um incident?

O que significa MTTA (Mean Time To Acknowledge)?

Outros temas de entrevista DevOps

Controle de versão & Git

Fundamentos do Linux

Shell Scripting & Bash

Fundamentos de Redes

Fundamentos do Docker

Fundamentos de CI/CD

GitHub Actions

GitLab CI/CD

Jenkins

Fundamentos do Kubernetes

Networking de Kubernetes

Kubernetes Avançado

Ingress & API Gateway

Fundamentos do Terraform

Terraform Avançado

Ansible & Configuration Management

Fundamentos do AWS

Fundamentos do Azure

Fundamentos do GCP

Monitoramento e Prometheus

Logging & ELK Stack

Cloud Identity & Secrets

Segurança de Pipelines CI/CD

Helm & Kubernetes

Segurança Runtime e Cluster

Container Supply Chain Security

Service Mesh & Istio

GitOps & ArgoCD

Progressive Delivery

Observabilidade Distribuída

Disaster Recovery & Backup

Otimização de Desempenho

Otimização de Custos na Nuvem

Princípios de SRE

Chaos Engineering

Platform Engineering

Domine DevOps para sua proxima entrevista