MTTA (Mean Time to Acknowledge) gibt an, wie schnell ein Incident nach Auslösung bestätigt wird. MTTR (Mean Time to Resolve) ist die Zeit bis zur vollständigen Behebung eines Incidents. Beide Kennzahlen sind wichtige Metriken im Incident-Management – sie dienen dazu, Ausfallzeiten zu reduzieren und SLAs zu verbessern.
MTTA, oder Mean Time to Acknowledge, bezeichnet die durchschnittliche Zeit zwischen dem Auslösen einer Alarmierung und deren Bestätigung durch eine Person. Diese Kennzahl betrifft die Reaktionsgeschwindigkeit der Bereitschafts- oder Support-Teams. Ein niedriger MTTA-Wert bedeutet:
MTTR, oder Mean Time to Resolve, misst die durchschnittliche Zeitspanne zwischen dem Erkennen eines Incidents und seiner vollständigen Behebung. Dazu zählen die Zeit für die Ursachenanalyse, die Behebung der Ursache und die Verifizierung der Lösung. Ein niedriger MTTR-Wert bedeutet:
Beide Kennzahlen werden als zeitbasierte Durchschnittswerte berechnet:
Für eine genaue Berechnung sollten Incidents in jeder Phase (ausgelöst, bestätigt, behoben) mit Zeitstempeln versehen und konsistent in einer Incident-Management-Plattform wie ilert nachverfolgt werden.
Beispiel (MTTA):
Beispiel (MTTR):
Im Folgenden finden Sie Beispiele für größere Ausfälle mit dokumentierten MTTA- und MTTR-Werten:
Beide Kennzahlen sind zentrale KPIs für SRE und DevOps. Sie helfen Unternehmen
Die Nachverfolgung dieser Metriken deckt auch versteckte Schwächen im Incident-Management auf, z. B. langsame Bestätigungen oder unklare Zuständigkeiten. Eine regelmäßige Messung dieser Kennzahlen gibt Führungskräften einen besseren Überblick über die Reaktionsfähigkeit ihrer Teams und die Resilienz des gesamten Systems.
Weitere Details finden Sie in unserem Leitfaden zu Kennzahlen im Incident-Management.
Eine Analyse von Performance-Clustern im State of DevOps Report 2024 zeigt, dass Unternehmen, die als “Elite” eingestuft wurden, sowohl höchste Geschwindigkeit als auch Stabilität erreichen – schnelle Wiederherstellungszeiten (MTTR) gehen meist mit kurzen Umsetzungszeiten einher. Die Korrelation unterstreicht, warum MTTA und MTTR gemeinsam betrachtet werden sollten, um operative Exzellenz zu erkennen.
So unterstützt ilert Unternehmen bei der Senkung der beiden Werte:
Q: Was ist der Unterschied zwischen MTTA und MTTR?
MTTA misst, wie schnell Incidents im Durchschnitt bestätigt werden, während MTTR misst, wie lange es dauert, Störungen vollständig zu beheben. MTTA steht für Reaktionsgeschwindigkeit, MTTR für Effizienz bei der Problemlösung.
Q: Wie oft sollte man MTTA und MTTR erfassen?
Erfassen Sie beide Metriken kontinuierlich – idealerweise in Echtzeit über eine Incident-Management-Plattform – und prüfen Sie sie mindestens monatlich, um Trends und Verbesserungsbedarf zu erkennen.
Q: Bezieht MTTR auch geplante Wartungen ein oder nur ungeplante Incidents?
MTTR misst in der Regel die Zeit zur Behebung ungeplanter Incidents. Geplante Wartungsfenster sind ausgeschlossen; hierfür werden separate Wartungsmetriken verwendet.
Q: Wie werden Anomalien in MTTA/MTTR-Werten behandelt?
Große Ausfälle oder gescheiterte Upgrades können zu einer Verzerrung der Durchschnittswerte führen. Die Verwendung von Medianwerten oder prozentilbasierten Messgrößen (z. B. 95. Perzentil MTTR) liefert zuverlässige Erkenntnisse.