Powrót do aktualności
ReloadiumDevOpsZarządzanie incydentamiPost-mortem

Post-mortem bez obwiniania: jak uczyć się na incydentach bez niszczenia zespołu

Post-mortemy zrobione źle niszczą zaufanie w zespole. Zrobione dobrze są najcenniejszym rytuałem inżynierskim, jaki możesz prowadzić.

Dlaczego większość post-mortemów zawodzi

Klasyczny sposób niepowodzenia: incydent się zdarza, ktoś organizuje spotkanie post-mortem, zespół siada w sali, menedżer pyta "co poszło nie tak" i ludzie cicho wskazują na siebie nawzajem.

Nikt się niczego nie uczy. Przyczyna źródłowa pozostaje ukryta. Ten sam incydent zdarza się ponownie trzy miesiące później.

Zasada bez obwiniania

Obwinianie jest wrogiem uczenia się. Post-mortemy bez obwiniania działają w oparciu o inne założenie: systemy zawodzą, nie ludzie.

Format post-mortem, który działa

  1. Rekonstrukcja chronologii — fakty, nie opinie
  2. Ocena wpływu — określ zasięg zniszczeń
  3. Czynniki przyczyniające się — wymień warunki, które umożliwiły incydent
  4. Co poszło dobrze — zachowaj wiedzę instytucjonalną
  5. Działania z właścicielami i terminami — skategoryzowane jako Napraw / Zapobieź / Wykryj / Odpowiedz

Kiedy przeprowadzać post-mortem

W ciągu 24-48 godzin od rozwiązania.

Używanie AI do przyspieszenia post-mortemów

Reloadium Incident Response generuje ustrukturyzowane szkice post-mortem na podstawie opisu incydentu, skracając czas pisania z 2-3 godzin do mniej niż 30 minut.

Udostępnij