Voltar às notícias
ReloadiumDevOpsGestão de incidentesPost-mortem

O post-mortem sem culpa: como aprender com incidentes sem queimar a sua equipa

Os post-mortems mal feitos destroem a confiança da equipa. Bem feitos, são o ritual de engenharia mais valioso que pode realizar.

Por que a maioria dos post-mortems falha

O padrão clássico de falha: ocorre um incidente, alguém agenda uma reunião post-mortem, a equipa senta numa sala, um gestor pergunta "o que correu mal" e as pessoas apontam silenciosamente umas para as outras.

Ninguém aprende nada. A causa raiz permanece escondida. O mesmo incidente acontece novamente três meses depois.

O princípio sem culpa

A culpa é inimiga da aprendizagem. Os post-mortems sem culpa operam sob um pressuposto diferente: os sistemas falham, não as pessoas.

O formato post-mortem que funciona

  1. Reconstrução da linha do tempo — factos, sem opiniões
  2. Avaliação do impacto — quantifique o raio de impacto
  3. Fatores contribuintes — liste as condições que tornaram o incidente possível
  4. O que correu bem — preserve o conhecimento institucional
  5. Itens de ação com responsáveis e prazos — categorizados em Corrigir / Prevenir / Detetar / Responder

Quando realizar o post-mortem

Dentro de 24-48 horas após a resolução.

Usar IA para acelerar os post-mortems

O Reloadium Incident Response gera rascunhos estruturados de post-mortem com base na descrição do incidente, reduzindo o tempo de escrita de 2-3 horas para menos de 30 minutos.

Partilhar