O post-mortem sem culpa: como aprender com incidentes sem queimar a sua equipa
Os post-mortems mal feitos destroem a confiança da equipa. Bem feitos, são o ritual de engenharia mais valioso que pode realizar.
Por que a maioria dos post-mortems falha
O padrão clássico de falha: ocorre um incidente, alguém agenda uma reunião post-mortem, a equipa senta numa sala, um gestor pergunta "o que correu mal" e as pessoas apontam silenciosamente umas para as outras.
Ninguém aprende nada. A causa raiz permanece escondida. O mesmo incidente acontece novamente três meses depois.
O princípio sem culpa
A culpa é inimiga da aprendizagem. Os post-mortems sem culpa operam sob um pressuposto diferente: os sistemas falham, não as pessoas.
O formato post-mortem que funciona
- Reconstrução da linha do tempo — factos, sem opiniões
- Avaliação do impacto — quantifique o raio de impacto
- Fatores contribuintes — liste as condições que tornaram o incidente possível
- O que correu bem — preserve o conhecimento institucional
- Itens de ação com responsáveis e prazos — categorizados em Corrigir / Prevenir / Detetar / Responder
Quando realizar o post-mortem
Dentro de 24-48 horas após a resolução.
Usar IA para acelerar os post-mortems
O Reloadium Incident Response gera rascunhos estruturados de post-mortem com base na descrição do incidente, reduzindo o tempo de escrita de 2-3 horas para menos de 30 minutos.