
Alerting & Incident Response
Runbooks, paging, escalation, incident management, on-call practices, postmortems, troubleshooting alerts
1Qu'est-ce qu'un runbook dans le contexte DevOps ?
Qu'est-ce qu'un runbook dans le contexte DevOps ?
Réponse
Un runbook est un document opérationnel qui contient des procédures standardisées pour gérer des incidents ou des tâches de maintenance récurrentes. Il permet aux équipes on-call de suivre des étapes prédéfinies et validées pour résoudre rapidement des problèmes connus, réduisant ainsi le temps de résolution et les erreurs humaines. Les runbooks peuvent être manuels ou automatisés et constituent un élément fondamental de la gestion des incidents.
2Qu'est-ce que le paging dans le contexte de la gestion des incidents ?
Qu'est-ce que le paging dans le contexte de la gestion des incidents ?
Réponse
Le paging est le mécanisme d'alerte qui notifie les ingénieurs de garde (on-call) lorsqu'un incident critique survient. Ce système utilise différents canaux de communication comme les SMS, les appels téléphoniques ou les applications dédiées pour garantir que la personne responsable soit alertée rapidement, même en dehors des heures de travail. Un bon système de paging intègre des politiques d'escalation automatique si la première personne ne répond pas.
3Qu'est-ce qu'un postmortem dans le contexte de la gestion des incidents ?
Qu'est-ce qu'un postmortem dans le contexte de la gestion des incidents ?
Réponse
Un postmortem est une analyse rétrospective réalisée après un incident significatif. Son objectif est de comprendre les causes profondes de l'incident, documenter la chronologie des événements, identifier les actions correctives et partager les apprentissages avec l'équipe. Un postmortem efficace adopte une approche blameless, centrée sur l'amélioration des systèmes et des processus plutôt que sur la responsabilité individuelle.
Quelle est la différence entre un event et un incident ?
Que signifie MTTA (Mean Time To Acknowledge) ?
+17 questions d'entretien
Autres sujets d'entretien DevOps
Contrôle de version & Git
Fondamentaux Linux
Shell Scripting & Bash
Bases du Networking
Fondamentaux Docker
Fondamentaux CI/CD
GitHub Actions
GitLab CI/CD
Jenkins
Les bases de Kubernetes
Networking Kubernetes
Kubernetes Avancé
Ingress & API Gateway
Les bases de Terraform
Terraform Avancé
Ansible & Configuration Management
AWS Essentiels
Fondamentaux Azure
Fondamentaux GCP
Monitoring & Prometheus
Logging & ELK Stack
Cloud Identity & Secrets
Sécurité Pipelines CI/CD
Helm & Kubernetes
Sécurité Runtime & Cluster
Container Supply Chain Security
Service Mesh & Istio
GitOps & ArgoCD
Progressive Delivery
Observabilité Distribuée
Disaster Recovery & Backup
Optimisation des Performances
Optimisation des Coûts Cloud
Principes SRE
Chaos Engineering
Platform Engineering
Maîtrise DevOps pour ton prochain entretien
Accède à toutes les questions, flashcards, tests techniques, exercices de code review et simulateurs d'entretien.
Commencer gratuitement