Volver a las noticias
ReloadiumDevOpsGestión de incidentesPost-mortem

El post-mortem sin culpas: cómo aprender de los incidentes sin quemar a tu equipo

Los post-mortems mal hechos destruyen la confianza del equipo. Bien hechos, son el ritual de ingeniería más valioso que puedes realizar.

Por qué la mayoría de los post-mortems fallan

El modo de falla clásico: ocurre un incidente, alguien programa una reunión post-mortem, el equipo se sienta en una sala, un gerente pregunta "qué salió mal" y la gente señala silenciosamente a otros o evita hablar.

Nadie aprende nada. La causa raíz permanece oculta. El mismo incidente ocurre de nuevo en 3 meses.

El principio sin culpa

La culpa es el enemigo del aprendizaje. Los post-mortems sin culpa operan bajo un supuesto diferente: los sistemas fallan, no las personas.

El formato de post-mortem que funciona

  1. Reconstrucción de la línea de tiempo — hechos, no opiniones
  2. Evaluación del impacto — cuantifica el radio de impacto
  3. Factores contribuyentes — lista las condiciones que hicieron posible el incidente
  4. Qué salió bien — preserva el conocimiento institucional
  5. Elementos de acción con propietarios y plazos — categorizados en Reparar / Prevenir / Detectar / Responder

Cuándo realizar el post-mortem

Dentro de las 24-48 horas posteriores a la resolución.

Usar IA para acelerar los post-mortems

Reloadium Incident Response genera borradores estructurados de post-mortem basados en la descripción del incidente, reduciendo el tiempo de redacción de 2-3 horas a menos de 30 minutos.

Compartir