El post-mortem sin culpas: cómo aprender de los incidentes sin quemar a tu equipo
Los post-mortems mal hechos destruyen la confianza del equipo. Bien hechos, son el ritual de ingeniería más valioso que puedes realizar.
Por qué la mayoría de los post-mortems fallan
El modo de falla clásico: ocurre un incidente, alguien programa una reunión post-mortem, el equipo se sienta en una sala, un gerente pregunta "qué salió mal" y la gente señala silenciosamente a otros o evita hablar.
Nadie aprende nada. La causa raíz permanece oculta. El mismo incidente ocurre de nuevo en 3 meses.
El principio sin culpa
La culpa es el enemigo del aprendizaje. Los post-mortems sin culpa operan bajo un supuesto diferente: los sistemas fallan, no las personas.
El formato de post-mortem que funciona
- Reconstrucción de la línea de tiempo — hechos, no opiniones
- Evaluación del impacto — cuantifica el radio de impacto
- Factores contribuyentes — lista las condiciones que hicieron posible el incidente
- Qué salió bien — preserva el conocimiento institucional
- Elementos de acción con propietarios y plazos — categorizados en Reparar / Prevenir / Detectar / Responder
Cuándo realizar el post-mortem
Dentro de las 24-48 horas posteriores a la resolución.
Usar IA para acelerar los post-mortems
Reloadium Incident Response genera borradores estructurados de post-mortem basados en la descripción del incidente, reduciendo el tiempo de redacción de 2-3 horas a menos de 30 minutos.