AI-First Incident Management. Mit Fokus auf Datenschutz.

Entwickelt, um Teams mit intelligenten Agenten zu ergänzen, während der Mensch die Kontrolle behält.

Kostenlos starten

Demo buchen

Benefits

Die Komplettlösung für Betriebsteams

ilert ist die Incident-Management-Lösung, die von Grund auf als Single-Application konzipiert wurde und den gesamten Lebenszyklus der Reaktion auf Vorfälle abdeckt.

Zuverlässige Alarmierung

Zuverlässige Benachrichtigungen per Sprach-, SMS- und Push-Benachrichtigungen. Reibungslose Bestätigung, ohne jegliche Anmeldung.

Rufbereitschafts-Management

Informieren Sie immer die richtige Person und verteilen Sie die Verantwortung für den Bereitschaftsdienst auf Ihr gesamtes Team mit Bereitschaftsplänen und automatischen Eskalationen.

Statusseiten

Bauen Sie Vertrauen auf und kommunizieren Sie Vorfälle innerhalb von Sekunden mit Statusseiten, die mit Ihrer Infrastruktur verbunden sind.

Vorfall-Kommunikation

Kommunizieren Sie IT-Vorfälle effektiv in Sekundenschnelle an Stakeholder in der gesamten Servicekette.

Call Routing

Leitet eingehende Anrufe effizient auf der Grundlage von Zeitplänen und Eskalationspfaden weiter und gewährleistet so eine schnelle Reaktion auf Vorfälle.

ChatOps

Integriert Tools für die Zusammenarbeit wie Slack und optimiert so die Kommunikation und Entscheidungsfindung bei Vorfällen innerhalb der Chat-Kanäle.

ilert KI

AI-first. All-in-one incident management.

Intelligente Agenten für jede Phase des Incident-Management-Prozesses.

Entdecken Sie alle KI-Funktionen

Ihr smarter Assistent für die Dienstplan-Erstellung

Geben Sie Ihre Anforderungen einfach in eine Chat-ähnliche Benutzeroberfläche ein. Fügen Sie Teammitglieder, Rotationsregeln und Zeiträume hinzu – und Sie erhalten im Handumdrehen einen sofort einsatzbereiten Dienstplan, auf den alle zugreifen können.

Lassen Sie die KI den Anruf entgegennehmen

Der KI-gestützte ilert Sprachagent ist Ihr erster Kontakt für eingehende Anrufe. Er begrüßt Anrufer, erfasst alle Informationen und übergibt den Incident mit klaren Details an den zuständigen Techniker.

Sekundenschnelle Status-Updates

Die ilert-KI versteht Ihre Systeme sowie die verschiedenen Incident-Arten und erstellt klare, zeitnahe Statusmeldungen. Während Sie die Störung beheben, formuliert sie professionelle Mitteilungen für die jeweiligen Empfänger.

ilert Responder – Ihr Incident-Berater in Echtzeit

Der ilert Responder ist ein intelligenter Agent, der Incidents in Echtzeit analysiert. Er kann mit Ihrem Observability-Stack verbunden werden, Alarmierungen systemübergreifend analysieren und umsetzbare Erkenntnisse liefern – wobei Ihr Team die volle Kontrolle behält.

Funktionen

Automatische Analyse von Protokollen, Metriken und letzten Änderungen
Erkennung von Ursachen und ähnlichen Incidents in der Vergangenheit
Vorschlagen von passenden Respondern, Rollback-Optionen oder betroffenen Diensten
Beantwortung von Fragen in natürlicher Sprache mit fundierten, nachvollziehbaren Ergebnissen

Integrationen

Starten Sie sofort mit unseren Integrationen

ilert stellt mithilfe unserer vorgefertigten Integrationen oder per E-Mail eine nahtlose Verbindung zu Ihren Tools her. Ilert lässt sich in Überwachungs-, Ticketing-, Chat- und Kollaborationstools integrieren.

Kostenlos starten

Integrationen entdecken

Transformieren Sie Ihre Incident Response.

Kostenlos starten

Kundenstimmen

So erreichen führende Unternehmen mit ilert eine Uptime von 99,9 %

Unternehmen weltweit vertrauen auf ilert, um ihr Incident-Management zu optimieren, die Zuverlässigkeit zu steigern und Ausfallzeiten zu minimieren. Lesen Sie, was unsere Kunden über ihre Erfahrungen mit unserer Plattform sagen.

„Wir nutzen ilert, um Störungen zu beheben, noch bevor unsere Kunden sie bemerken. ilert gibt unseren Engineering- und Operationsteams die Sicherheit, dass wir rechtzeitig reagieren können.“

Dr. Robert Zores

Chief Technology Officer

„Andere Teams prüfen nun, ob sie ilert ebenfalls nutzen möchten.“

Thilo Maass

Manager at Adesso AG

Bleiben Sie auf dem Laufenden

Neues aus unserem Blog

Engineering

Wie wir agentische Incident Response aufgebaut haben

Erfahren Sie, wie ilert die Vision einer agentischen Incident Response in die Produktion überführt hat und so manuelle Arbeit, MTTR und Alarmflut für moderne Bereitschaftsteams reduziert.

Tim Gühnemann

Jul 02, 2025 • 5 min read

KI verändert bereits heute, wie wir Ausfälle erkennen, darauf reagieren und sie beheben. Herkömmliche Workflows zwingen Einsatzkräfte oft dazu, zwischen Dashboards zu wechseln, Protokolle zu durchsuchen und unter Stress über fragmentierte Kanäle zu koordinieren. Dieser reaktive, manuelle Ansatz führt zu langsameren Lösungen, höheren Betriebskosten und Burnout – insbesondere, da IT-Systeme immer komplexer werden.

‍

Bei ilert sprechen wir nicht nur über die Zukunft des Incident-Managements – wir gestalten sie aktiv. Wir haben agentische Incident Response in die Produktion gebracht, um operative Exzellenz zu ermöglichen und gleichzeitig manuelle Arbeit sowie die kognitive Belastung für Bereitschaftsteams zu reduzieren. So haben wir diese Vision Wirklichkeit werden lassen.

‍

Lesen Sie unseren Blogbeitrag zur agentischen Incident Response und zur Einführung des ilert Responder.

Die Grundlage schaffen: Hive und der ilert AI Voice Agent

Unser Weg zur agentischen Incident Response begann mit Architekturentscheidungen, die Flexibilität, Skalierbarkeit und intelligente Aktionen über alle Phasen des Incident Response Lebenszyklus priorisieren.

‍

Hive: Unsere LLM-Orchestrierungsschicht

Hive ist unsere proprietäre Proxy- und Orchestrierungsschicht für Large Language Models (LLMs). Sie ermöglicht intelligente Incident-Zusammenfassungen, kontextbezogene Empfehlungen und erweiterte Workflows in ilert, indem sie mehrere Modellanbieter verwaltet, Workloads optimal verteilt und ein sicheres, konsistentes sowie leistungsstarkes KI-Rückgrat für alle Anwendungsfälle bereitstellt.

‍

Hive erlaubt es uns, neue LLMs nahtlos zu integrieren, Kosten durch die Zuweisung von Aufgaben an das passende Modell zu optimieren und den Datenschutz zu wahren, während gleichzeitig hochgradig kontextuelle Intelligenz in Echtzeit geliefert wird.

‍

AI voice agent für nahtlose Interaktion der Responder

Communication is critical during incidents, especially when responders need to act without being tethered to keyboards. Our AI voice agent enables responders to gather updates or report incidents verbally, integrating into existing call flows as a natural part of the process. It transforms voice interactions into structured, actionable alerts while synthesising updates from diverse data sources, bridging human intuition with automated data-driven action.

‍

Kommunikation ist während Incidents entscheidend – besonders, wenn Responder handeln müssen, ohne an Tastaturen gebunden zu sein. Unser AI Voice Agent ermöglicht es Einsatzkräften, Updates abzurufen oder Incidents verbal zu melden. Er integriert sich in bestehende Anrufabläufe (Call flows) als natürlicher Bestandteil des Prozesses, wandelt Sprachinteraktionen in strukturierte, umsetzbare Alarme um und fasst Informationen aus verschiedenen Datenquellen zusammen. So verbindet er menschliche Intuition mit datengetriebenen, automatisierten Aktionen.

Was ist MCP (Model Context Protocol)?

Das Model Context Protocol (MCP) ist ein dynamisches Echtzeit-Protokoll von Anthropic, das Ihre Daten mit dem ilert Responder verbindet und dabei den reichhaltigen, strukturierten Kontext liefert, den unsere Agents während Incidents benötigen, um intelligent handeln zu können.

‍

Warum haben wir MCP entwickelt?

Traditionelle Integrationen lassen Systeme häufig isoliert, sodass während Incidents manuell Korrelationen zwischen Telemetrie, Logs und Infrastrukturzustand hergestellt werden müssen. MCP beseitigt diese Silos, indem es incident-relevanten Kontext automatisch in Echtzeit aggregiert, strukturiert und überträgt.

‍

Wie funktioniert MCP?

MCP sammelt Daten aus Ihren Monitoring-Systemen, Log-Aggregatoren, Deployment-Pipelines und Infrastrukturumgebungen, verarbeitet sie in einer sicheren, EU-konformen Multi-Tenant-Architektur und liefert nur die erforderlichen Daten an unsere agentischen Responder. Dadurch

‍

erhält der Agent Echtzeit- und Detailkenntnis über Incidents,
bleiben Datensicherheit, Isolation und Compliance gewahrt,
wird manuelle Korrelation und kognitive Belastung in kritischen Momenten reduziert,
ermöglicht MCP latenzarme, kontextreiche Interaktionen mit dem ilert Responder.

‍

Stellen Sie sich MCP als neuronales Netzwerk vor, das Ihren Observability-Stack, Code-Repos und Ihre Infrastruktur direkt mit unseren KI-Systemen verbindet. So sind Entscheidungen und Vorschläge stets kontextgenau, umsetzbar und relevant.

Die ilert Responder-Pipeline: Vom Alarm zu agentisch vorgeschlagenen Aktionen

Wir haben eine End-to-End-Pipeline entwickelt, die Monitoring-Signale in intelligente, umsetzbare Workflows verwandelt, um die Incident-Auflösung zu beschleunigen.

‍

Event Flow → Alert

Der ilert Event Flow nimmt Monitoring-Signale auf und wendet Ihre Regeln sowie Schwellenwerte an, um Alarme auszulösen, sobald bestimmte Bedingungen erfüllt sind. So werden die richtigen Teams sofort benachrichtigt, ohne unnötigen Lärm.

‍

MCP tritt in Aktion

Direkt nach der Alarmerstellung ruft MCP relevante Telemetriedaten, Logs, aktuelle Deployment-Änderungen und Infrastrukturstatus ab, strukturiert sie und stellt sie dem ilert Responder sicher zur Verfügung. So hat der Responder umfassende Situational Awareness, ohne dass menschliche Beteiligte Kontext zusammensuchen müssen. Dies geschieht durch kontextbewusste Integrationen mit

‍

Observability-Tools: um Telemetrie- und Zeitreihendaten aus Prometheus und Grafana abzurufen;
Code-Repositories: um Commit-Historie und Deployment-Metadaten aus GitHub einzusehen;
Infrastruktur-Umgebungen: um Echtzeit-Status und Konfigurationen aus Kubernetes zu erfassen.

‍

ilert Responder schlägt Aktionen vor

Der ilert Responder nimmt die Daten in Echtzeit auf, korreliert sie und wird so zu einem intelligenten Teilnehmer der Incident Response statt nur zu einem passiven Benachrichtigungssystem. Dank seines tiefen, kontextuellen Verständnisses formuliert der Responder umsetzbare Empfehlungen wie

‍

Vorschläge zur Grundursachenanalyse (Root Cause),
Schritt-für-Schritt-Anleitungen zur Behebung,
Eskalationspfade und Einblicke in Abhängigkeiten.

‍

Diese Vorschläge erscheinen in der ilert-Chat-Oberfläche, sodass Responder Aktionen prüfen, freigeben oder anpassen können, um sie während laufender Incidents sicher auszuführen. Die interaktive Chat-UI entwickelt sich zu einem Command Center, das es Einsatzkräften ermöglicht,

‍

dynamisch tiefere Einblicke anzufordern,
direkte Aktionen wie das Skalieren von Kubernetes-Pods auszuführen,
vorgeschlagene Ursachen und Metriken nahtlos zu vertiefen.

Operative Verbesserungen

Die agentische Incident Response bei ilert liefert greifbare Ergebnisse für Engineering- und Betriebsteams:

‍

Echtzeit-Log-Korrelation und Root-Cause-Inference, um wahrscheinliche Ursachen innerhalb von Momenten zu identifizieren;
Diagnostische Zusammenfassungen, die menschenlesbare, umsetzbare Incident-Überblicke bieten;
Interaktive Q & A in natürlicher Sprache mit dem Agenten für eine schnelle Datenabfrage und kontextuelle Klarheit;
Umsetzbare Remediation-Vorschläge mit direkten, sicheren Ausführungs-Workflows;
Automatisierte Postmortems und Zeitachsen, die den manuellen Dokumentationsaufwand nach einem Incident reduzieren.

‍

Durch geringere manuelle Arbeit und schnellere Klarheit verbringen Teams weniger Zeit mit Incident-Management und können sich stärker auf die Bereitstellung zuverlässiger Services konzentrieren.

Zentrale Erkenntnisse und Best Practices

Der Aufbau und Betrieb agentischer Systeme für mission-kritisches Incident-Management bei ilert hat uns Folgendes gelehrt:

‍

Vertrauen durch Transparenz: Autonome Datenerfassung, Korrelation und sichere, vorab genehmigte Aktionen erfolgen ohne manuelle Schritte und reduzieren die kognitive Last für Responder. Bei höherem Risiko oder geschäftskritischen Aktionen können Teams zusätzliche Freigaben einbauen. Volle Transparenz darüber, was der Agent tut und warum, schafft Vertrauen, ohne die Lösung zu verzögern.
Schutz vor Halluzinationen: Reichhaltiger, strukturierter und verifizierter Kontext über MCP stellt sicher, dass der Agent mit konsistenten, zuverlässigen Informationen arbeitet und das Risiko ungenauer Vorschläge oder Aktionen deutlich sinkt.
Performance-Optimierung für geringe Latenz: Incident Response ist zeitkritisch. Durch spekulative Tool-Aufrufe und optimierte Datenpfade stellen wir sicher, dass Erkenntnisse und Aktionen nahezu in Echtzeit generiert werden – entscheidend für eine geringere MTTR.
Kontinuierliches Lernen: Integrierte Feedback-Schleifen verfeinern die Empfehlungen und Aktionen unseres Agents kontinuierlich, verbessern Genauigkeit und Effektivität mit jedem Incident.
‍Sichere autonome Ausführung: Durch klar definierte, kontrollierte Bereiche für automatisierte Behebungen kann der Agent geeignete Korrekturmaßnahmen eigenständig ausführen und so die Lösung beschleunigen, während Betriebssicherheit und Rollback-Fähigkeiten erhalten bleiben.

Fazit: Agentische Incident Response ist bereits Realität

Wir bei ilert sind überzeugt, dass die Ära des manuellen, reaktiven Incident-Managements zu Ende geht und die Vorteile agentischer Automatisierung zu bedeutend sind, um sie aufzuschieben. Wir sind stolz, diese fortschrittlichen Funktionen in die Produktion gebracht zu haben, manuelle Arbeit zu reduzieren, MTTR zu senken und Teams zu befähigen, sich auf das Wesentliche zu konzentrieren: Zuverlässigkeit und Innovation.

‍

Während der ilert Responder bereits die Datenerhebung, Analyse und Empfehlungen zur Störungsbehebung automatisiert, stellt dieses Release nur den ersten Meilenstein dar. Unser nächstes Ziel ist es, dass der ilert Responder klar definierte, risikoarme Incidents – wie fehlerhafte Health Checks oder temporäre Latenzspitzen – vollständig eigenständig löst. Menschliche Responder behalten stets die Kontrolle, doch ein Großteil der routinemäßigen Aufgaben wird entfallen.

‍

Möchten Sie das in Aktion sehen? Entdecken Sie den ilert Responder, nehmen Sie an unserem Beta-Programm teil oder kontaktieren Sie uns für eine persönliche Demo, um agentische Incident Response in Ihren Bereitschaftsworkflow zu integrieren.

Insights

Vergütung von Rufbereitschaften in IT-Unternehmen 2025

2025 Leitfaden zur Entlohnung für Rufbereitschaften: TVöD-Benchmark, weltweite Zahlungsstandards, Vergütungsmodelle, gesetzliche Regelung von Bereitschaftsdiensten und Best Practices für die Mitarbeitergesundheit

Daniel Weiß

Jun 30, 2025 • 5 min read

Stellen Sie sich folgendes Szenario vor: Es ist 2 Uhr morgens, ein kritisches System bricht ohne Vorwarnung zusammen. Der völlig übermüdete diensthabende Techniker hetzt los, stellt den Service wieder her und schützt Ihre Kunden vor einem massiven Ausfall, der Ihre nächste Service Level Objective (SLO)-Überprüfung gefährden könnte. Am nächsten Morgen findet wie so oft eine hitzige Diskussion über die faire Bezahlung von Rufbereitschaften statt: Was ist eigentlich eine "angemessene" Vergütung für schlaflose Nächte, unberechenbare Benachrichtigungen und eine umgehende Incident-Response?

Was zählt als Rufbereitschaft?

Rufbereitschaft ist eine besondere Arbeitszeitregelung im Arbeitsrecht. Sie tritt in Kraft, wenn der Arbeitnehmer verpflichtet ist, mindestens telefonisch erreichbar zu sein, damit er im Notfall seine Arbeit aufnehmen kann. Rufbereitschaft wird in der Regel als Zeit gezählt, die speziell für Arbeitszwecke vorgesehen ist.

‍

Praktisch heißt das: Während der Rufbereitschaft dürfen Mitarbeiter in der Regel keiner anderen Arbeit nachgehen. Es gibt jedoch Ausnahmen. Ist der Mitarbeiter über ein Dienstgerät erreichbar, kann er diese Zeit auch im Home-Office verbringen.

Was ist der Unterschied zwischen Rufbereitschaft und Bereitschaftsdienst?

Beide Modelle unterscheiden sich sowohl in der zeitlichen als auch in der örtlichen Komponente:

‍

Rufbereitschaft - Der Mitarbeiter ist per Telefon, Pager oder On-Call-App erreichbar und kann sich von überall einloggen, sobald eine Alarmierung eintrifft.

‍

Bereitschaftsdienst - Der Mitarbeiter muss vor Ort anwesend sein und sofort handeln können. Das deutsche Arbeitsrecht stuft diesen Bereitschaftsdienst vollständig als Arbeitszeit ein und regelt die Vergütung entsprechend

‍

Im IT-Betrieb setzt man meist auf Remote-Dienstbereitschaft, weil sich die meisten Incidents (Code-Rollbacks, Config-Tweaks) bequem über VPN lösen lassen. Für latenzkritische Umgebungen bleibt der Bereitschaftsdienst jedoch unverzichtbar, etwa bei Trading-Plattformen oder industriellen Steueranlagen, wo Techniker die Hardware überwachen und innerhalb von Sekunden eingreifen müssen, um strenge Service-Level-Agreements einzuhalten.

Zählt Rufbereitschaft als Arbeitszeit?

Ob Rufbereitschaft als Arbeitszeit zählt, ist nicht so eindeutig festgelegt, wie man denken könnte. Nach den meisten arbeitsrechtlichen Regelwerken, darunter auch die Vorgaben zur Arbeitssicherheit und das US-amerikanische FLSA Fact Sheet #22, gilt passive Rufbereitschaft als Ruhezeit, solange keine Alarmierung eingeht.

‍

Sobald der Mitarbeiter jedoch eine Alarmierung erhält und mit der Problemlösung beginnt, wird diese Zeit zur aktiven Arbeitszeit.

‍

In Grenzfällen entscheiden Gerichte, etwa das BAG in seinem Urteil vom Oktober 2023 (Az. 6 AZR 210/22), darüber, welche Zeiträume als Arbeitszeit gelten. Deshalb unterscheiden sich die Definitionen oft je nach Rechtsraum und Unternehmensrichtlinie.

‍

Auch bei der Bezahlung gibt es keine einheitliche Regel. Viele Arbeitgeber behandeln Rufbereitschaft als vergütete Arbeitszeit und zahlen entsprechend. Andere stufen passive Erreichbarkeit hingegen als unbezahlten Bereitschaftsdienst ein. Wenn Ihr Unternehmen dieses Modell anwendet, gilt: Erreichbarkeit ohne aktiven Einsatz wird nicht vergütet.

‍

Fazit: Rufbereitschaft gilt nicht automatisch als Arbeitszeit, entscheidend ist die Vergütungspolitik des Arbeitgebers. Große Technologieunternehmen wie Airbnb, Apple oder Netflix zahlen nicht für passive Rufbereitschaft, während viele europäische IT-Unternehmen es anders handhaben.

‍

Zeiten der Rufbereitschaft

Rufbereitschaft wird in der Regel auf bestimmte Nächte oder Wochenenden beschränkt, die vorab vereinbart und im Arbeitsvertrag festgehalten sind. Da zu diesen Zeiten weniger Personal vor Ort ist, ist eine verlässliche Abdeckung während der Nacht und am Wochenende wichtig.

‍

In Deutschland empfiehlt der IT-Branchenverband Bitkom, Rufbereitschaft auf maximal 56 Tage pro Kalenderjahr zu begrenzen und pro Schicht mindestens 8 Stunden ununterbrochene Ruhezeit zu garantieren (Bitkom-Leitfaden “Rufbereitschaft im IT-Betrieb”). Da Rufbereitschaft grundsätzlich als arbeitsfreie Zeit gilt, greift die gesetzlich vorgeschriebene Ruhepause von 11 Stunden nach §5 (1) des Arbeitszeitgesetzes erst dann, wenn der Techniker tatsächlich an einem Incident arbeitet.

Wie wird Rufbereitschaft in IT-Unternehmen vergütet?

In den meisten Unternehmen gilt Rufbereitschaft als bezahlte Arbeitszeit, aber wie genau abgerechnet wird, variiert stark. Die Vergütung ist im Arbeitsvertrag oder in internen Vergütungsrichtlinien geregelt.

‍

Einige große Technologieunternehmen, darunter Airbnb und Apple, zahlen angeblich nicht für passive Rufbereitschaft und verweisen darauf, dass ihre Techniker ohnehin am oberen Ende der Gehaltsskala liegen. Viele europäische Scale-ups hingegen zahlen entweder einen Zuschlag oder bieten Freizeitausgleich an.

‍

In Deutschland gibt es keinen gesetzlich geregelten Fixbetrag – das Bundesarbeitsministerium stellt klar: Die Höhe der Vergütung liegt im Ermessen des Arbeitgebers.

‍

In der Praxis dominieren zwei Modelle:

‍

Zuschlag auf den Stundenlohn
Ein prozentualer Aufschlag auf den regulären Stundenlohn für jede geplante Rufbereitschaftsstunde.

‍

Freizeitausgleich
Acht Stunden Rufbereitschaft ergeben vier Stunden bezahlten Urlaub.

‍

Wichtig: Nur die Minuten, in denen tatsächlich gearbeitet wird, gelten rechtlich klar als Arbeitszeit. Die reine Erreichbarkeit bleibt unbezahlt, es sei denn, das Unternehmen hat es anders geregelt.

Wie werden Bereitschaftsdienste in IT-Unternehmen vergütet?

Die Bezahlung variiert weiterhin je nach Unternehmensgröße, Branche und Risikoprofil. Der Tarifvertrag für den öffentlichen Dienst (TVöD) legt in § 8 Abs. 3 folgende Zuschläge fest:

‍

Bereitschaftsdienste ab 12 Stunden

Wochentage (Mo – Fr): Vergütung mit dem 2-fachen des Stundenlohns für den gesamten Tag.

Wochenenden und Feiertage: Vergütung mit dem 4-fachen des Stundenlohns für den gesamten Tag.

‍

Kürzere Bereitschaftsfenster (unter 12 Stunden)

‍
Hier fallen zusätzlich 12,5 % des Stundenlohns pro Stunde Rufbereitschaft an.

‍

In großen Konzernen oder erfolgreichen Start-ups können Arbeitnehmer mit etwa 1.000 € pro Woche für Rufbereitschaft rechnen. Bei Zalando liegt die Vergütung bei rund 1.050 €, bei dem Start-up HelloFresh bei 1.000 €, und bei Amazon Deutschland etwa bei 800 €.

‍

Auch mehrere Unternehmen im Finanzsektor zahlen vergleichbare Sätze, die genauen Beträge variieren jedoch. Laut dem Blog Pragmatic Engineer gelten folgende Werte:

‍

SumUp (Deutschland): 1.050 € pro Woche

N26 (Deutschland): 880 € pro Woche

Klarna (Europa): 500 € pro Woche

Mastercard (UK): 470 £ pro Woche

PayPal (Deutschland): 350 $ pro Woche

Wise (UK): 300 £ pro Woche

‍

Aktuelle Beiträge aus Engineer-Foren und Communities liefern weitere Vergleichswerte:

‍

Google - SRE-Rotation Tier 1 (fünf Minuten Reaktionszeit): Vergütung für 40 Minuten jeder On-Call-Stunde außerhalb der Bürozeiten (66 % des Basisstundenlohns).
Tier 2 (30 Minuten Reaktionszeit): 20 Minuten pro Stunde (33 %).

AWS - (EU-Tier-0-Services): 25 % des Basisgehalts pro On-Call-Stunde außerhalb der regulären Arbeitszeit, plus einen halben Tag bezahlten Urlaub für jede nächtliche oder samstägliche Alarmierung.

Mehr als Bezahlung: Mitarbeitergesundheit schützen

Geld ist nicht alles. Rufbereitschaft stört den Schlafrhythmus und beeinträchtigt das Privatleben, deshalb ist der Schutz der Mitarbeitergesundheit entscheidend. Diese fünf Punkte sind für Zufriedenheit und Wohlbefinden von IT-Teams wichtig:

‍

Erwartungen klar definieren: Reaktionszeiten und Eskalationspfade müssen klar definiert sein.
Fair rotieren: Schichten gerecht verteilen, mit Primär- und Sekundär-Rollen. Ein automatisierter Bereitschaftsplan sorgt für Transparenz.
Workload im Blick behalten: Zeiten je Techniker tracken, nächtliche Bereitschaftsdienste begrenzen. Mit den ilert-Berichten können zum Beispiel Muster erkannt werden.
Tools richtig nutzen: Deduplizierung von Alarmierungen und smarte Eskalationen reduzieren dank ilert die Alarmflut und verkürzen die Time-to-Sleep.
Training & Support anbieten: Vierteljährliche Notfallübungen oder Übungstage halten das Team einsatzbereit und sicher im Umgang mit kritischen Störungen.

Zusammenfassung

Rufbereitschaft im IT-Bereich bedeutet, außerhalb der regulären Arbeitszeiten für eventuelle Notfälle erreichbar zu sein, meist remote. Sie unterscheidet sich vom Bereitschaftsdienst, der die Anwesenheit vor Ort erfordert und immer als Arbeitszeit gilt. Im Gesetz gibt es keine Regelung, dass Rufbereitschaft automatisch vergütet wird, nur die aktive Reaktion auf Incidents zählt eindeutig als Arbeitszeit.

‍

Die Bezahlung für Rufbereitschaft variiert: Manche Unternehmen zahlen einen Zuschlag auf den Stundenlohn oder bieten Freizeitausgleich an, andere – etwa Apple oder Airbnb – vergüten passive Rufbereitschaft gar nicht. Bitkom empfiehlt in Deutschland maximal 56 Einsatztage pro Jahr mit mindestens 8 Stunden Ruhezeit pro Schicht.

‍

Wöchentliche Pauschalen liegen bei Firmen wie Zalando, HelloFresh und SumUp zwischen 800 € und 1.050 €. Best Practices zum Schutz der Mitarbeiter umfassen eine faire Regelung für Rotationen, klare Eskalationspfade, Tools zur Verringerung von Alarmflut und regelmäßige Trainings.

‍

Ankündigungen

ilert stellt Agentic Incident Response vor: der Beginn der AI-first-Ära

Der ilert Responder – Ihr KI-gestützter Incident-Co-Pilot für die Analyse von Alarmierungen, schnellere Störungsbehebung und zur Entlastung Ihres SRE-Teams – ohne die Kontrolle zu übernehmen.

Birol Yildiz

Jun 16, 2025 • 5 min read

Stellen Sie sich vor, Incidents ließen sich durch Erkenntnisse statt durch manuelle Intervention lösen.

‍

Stellen Sie sich weiter ein Incident-Management der Zukunft vor, in dem Sie bei kritischen Alarmierungen nie allein sind – Ihr bester Techniker würde stets für Sie da sein, Probleme unermüdlich untersuchen, Logs analysieren, Metriken korrelieren, kürzlich vorgenommene Code-Änderungen prüfen und sofort umsetzbare Erkenntnisse liefern. Diesen Schritt in die Zukunft gehen wir mit unserem ersten intelligenten Agenten: dem ilert Responder.

Warum AI-first?

Incident-Management entwickelt sich rasant weiter. Systeme werden komplexer, die Anzahl von Alarmierungen steigt sprunghaft an, der Druck auf die Teams nimmt zu. SREs sind häufig von Alarmflut überwältigt und müssen unter Zeitdruck Logs, Metriken und Dashboards analysieren, um Root-Causes aufzudecken.

‍

Bei ilert setzen wir seit über drei Jahren auf KI im Incident-Management – mit intelligenter Gruppierung von Alarmierungen, automatisierter Postmortem-Erstellung und darüber hinaus. Der ilert Responder ist kein Anfang, sondern ein Quantensprung. Er baut auf jahrelanger Erfahrung, Grundlagenarbeit und Kundenfeedback auf.

‍

Unser Fokus liegt kompromisslos darauf, die Mean Time to Resolution (MTTR) deutlich zu senken. Jede Entscheidung, jedes Feature bewerten wir gemäß der Frage: Wie trägt es dazu bei, die MTTR zu verringern? In GenAI und agentischen Systemen sehen wir transformatives Potenzial, genau dieses Ziel zu erreichen. Wir setzen auf eine Zukunft, in der Sie nur noch dann angepiept werden, wenn die KI einen Incident nicht autonom beheben kann. Keine Anrufe mehr um 3 Uhr nachts, nur um einen Dienst neu zu starten oder ein Deployment zurückzurollen.

‍

Darum verpflichten wir uns, eine AI-first-Plattform zu werden und künstliche Intelligenz in den Kern all unserer Aktivitäten zu integrieren. Der ilert Responder ist mehr als ein weiteres KI-Feature; es ist die fundamentale Neugestaltung der Incident-Response.

Lernen Sie den ilert Responder kennen: Ihren 24/7-Incident-Co-Piloten

‍

Der ilert Responder ist Ihr zuverlässiger Teamkollege und direkt in die ilert-Plattform integriert. Er

‍

lässt sich nahtlos mit Ihrem Observability-Stack, Ihrer Cloud-Infrastruktur und Ihrem Code-Repository verbinden,
analysiert Incidents in Echtzeit anhand verschiedener Datenquellen und identifiziert Root-Causes,
liefert klare, priorisierte Empfehlungen zur Behebung von Störungen.

Interagieren Sie über eine Chat-Schnittstelle: Stellen Sie Fragen, teilen Sie Kontext und erhalten Sie genau dann Rat, wenn Sie ihn brauchen. Jede Erkenntnis des ilert Responders ist klar, umsetzbar und durch Daten belegt – selbst unter Hochdruck.

‍

Im Kern nutzen wir das MCP (Model-Context Protocol), um den ilert Responder-Agenten mit Ihren Tools und Ihrer Infrastruktur zu verbinden. MCP ist für KI, was HTTP für das Web ist – ein Standardprotokoll, das LLM-basierte Agenten mit den Systemen verbindet, in denen reale Daten liegen. Es löst zwei grundlegende Herausforderungen: das begrenzte und veraltete Wissen von LLMs sowie die Komplexität individueller Integrationsschichten zwischen KI-Apps und externen Datenquellen.

‍

Dank MCP kann der ilert Responder sicher und kontextbezogen mit Tools wie Grafana, Prometheus, GitHub und Kubernetes interagieren – und dort Logs, Metriken, Deployment-Daten, Code-Änderungen und mehr in Echtzeit abrufen. Wir haben eine skalierbare Multi-Tenant-Architektur um MCP herum aufgebaut, mit der wir neue Datenquellen (MCP-Server) einfach hinzufügen können und so die Analysefähigkeiten des Responders mit jeder Integration erweitern.

Sehen Sie sich den ilert Responder in Aktion an

‍

Einführung von Agentic Incident Management

‍

Der ilert Responder bedeutet den Beginn dessen, was wir Agentic Incident Management nennen. Hier:

‍

schlussfolgern und untersuchen intelligente Agenten wie erfahrene Techniker,
lernen aus jeder Interaktion und werden stetig klüger,
arbeiten transparent Seite an Seite mit Menschen – wobei stets eine klare Übersicht gewährleistet ist.

‍

Standardmäßig arbeitet der neue ilert Responder im Read-only-Modus und unterbreitet Empfehlungen für eine schnellere Lösung. Er ersetzt Ihr Bereitschafts-Team nicht, sondern ergänzt es.

Nehmen Sie am Beta-Programm für ilert Agentic Incident Response teil

‍

Wir laden innovative Teams ein, an unserem Beta-Programm teilzunehmen und frühen Zugang zum ilert Responder zu erhalten. Als Beta-Tester

‍

gestalten Sie zukünftige Funktionen direkt mit,
genießen frühe Vorteile und Wettbewerbsvorsprung,
führen Ihre Branche in das Zeitalter des KI-gestützten Incident-Managements.

‍

Interesse? Schreiben Sie an support@ilert.com und gehören Sie zu den Ersten bei der AI-first-Incident-Response-Revolution.

‍

‍

AI-first-Incident-Management – für alle

KI-Features sind seit einigen Jahren integraler Bestandteil von ilert. Mit diesem nächsten Schritt sind KI-Funktionen nicht länger Premium-Plänen oder Add-ons vorbehalten; sie sind grundlegend.

‍

Wir haben bereits bedeutende Änderungen an unserer Preisgestaltung vorgenommen. Während der Beta-Phase steht der ilert AI Responder ohne zusätzliche Kosten zur Verfügung. Doch das ist nicht alles: Wir stellen unser AIOps-Add-on ein und machen KI-Funktionen wie intelligentes Alert-Grouping im Scale-Tarif verfügbar. Selbst Kunden in unserem Free-Tarif haben jetzt Zugriff auf KI-Features.

‍

Bald erhalten alle ilert-Kunden flexible AI-Credits, um erweiterte Funktionen freizuschalten – vom ilert Responder bis zum ilert Postmortem-Creator. Details zu unserem transparenten Preismodell mit Credits folgen in Kürze. Halten Sie sich über unseren Blog und Newsletter auf dem Laufenden.

Privacy-first, immer

Der Schutz und die Sicherheit Ihrer Daten haben bei uns höchste Priorität. Wir treiben AI-first voran, um die Incident-Behebung zu beschleunigen, und verankern zugleich Privacy-first mit Datensouveränität, End-to-End-Verschlüsselung, regionsspezifischer KI-Verarbeitung und DSGVO-Konformität. Wir entwickeln von Grund auf intelligente Systeme, die Datenschutz ebenso gewährleisten wie sie Innovation ermöglichen. Der ilert AI Responder basiert auf diesem Fundament.

‍

Für die ilert KI nutzen wir Foundation-Modelle, die je nach Standort bei AWS, Microsoft Azure oder OpenAI gehostet werden. Für Kunden in der EU findet die gesamte KI-Verarbeitung innerhalb Europas auf AWS- oder Microsoft-Infrastruktur statt – es verlassen keine Daten die EU, und es werden keine personenbezogenen oder sensiblen Informationen an OpenAI-Endpunkte außerhalb der EU gesendet. Kunden außerhalb der EU können OpenAI oder AWS nutzen, stets unter strengen Zugriffskontrollen sowie Verschlüsselung bei Speicherung und Übertragung.

‍

Darüber hinaus verwenden wir ausschließlich Daten, die Alarmierungen und Incidents betreffen, und teilen keine personenbezogenen Performancedaten mit externen KI-Modellen. Wir nutzen Ihre Daten nicht zum Training von Modellen und haben bei allen LLM-Anbietern ein Opt-out für Training aktiviert.

‍

Erfahren Sie mehr über unser Engagement für Sicherheit und Datenschutz im Q&A-Bereich.

‍

Wir beginnen eine neue Ära der Incident-Response – eine Ära, in der künstliche Intelligenz SREs nicht ersetzt, sondern sie auf eine neue Stufe bringt. Der ilert Responder ist erst der Anfang – die Zukunft ist kollaborativ, intelligent und menschenzentriert. Lassen Sie sie uns gemeinsam gestalten!

‍

Alle entdecken

AI-First Incident Management. Mit Fokus auf Datenschutz.

Die Komplettlösung für Betriebsteams

Zuverlässige Alarmierung

Rufbereitschafts-Management

Statusseiten

Vorfall-Kommunikation

Call Routing

ChatOps

AI-first. All-in-one incident management.

Ihr smarter Assistent für die Dienstplan-Erstellung

Lassen Sie die KI den Anruf entgegennehmen

Sekundenschnelle Status-Updates

ilert Responder – Ihr Incident-Berater in Echtzeit

Funktionen

Starten Sie sofort mit unseren Integrationen

So erreichen führende Unternehmen mit ilert eine Uptime von 99,9 %

Neues aus unserem Blog

Wie wir agentische Incident Response aufgebaut haben

Die Grundlage schaffen: Hive und der ilert AI Voice Agent

Hive: Unsere LLM-Orchestrierungsschicht

AI voice agent für nahtlose Interaktion der Responder

Was ist MCP (Model Context Protocol)?

Warum haben wir MCP entwickelt?

Wie funktioniert MCP?

Die ilert Responder-Pipeline: Vom Alarm zu agentisch vorgeschlagenen Aktionen

Event Flow → Alert

MCP tritt in Aktion

ilert Responder schlägt Aktionen vor

Operative Verbesserungen

Zentrale Erkenntnisse und Best Practices

Fazit: Agentische Incident Response ist bereits Realität

Vergütung von Rufbereitschaften in IT-Unternehmen 2025

Was zählt als Rufbereitschaft?

Was ist der Unterschied zwischen Rufbereitschaft und Bereitschaftsdienst?

Zählt Rufbereitschaft als Arbeitszeit?

Zeiten der Rufbereitschaft

Wie wird Rufbereitschaft in IT-Unternehmen vergütet?

Wie werden Bereitschaftsdienste in IT-Unternehmen vergütet?

Bereitschaftsdienste ab 12 Stunden

Kürzere Bereitschaftsfenster (unter 12 Stunden)

Mehr als Bezahlung: Mitarbeitergesundheit schützen

Zusammenfassung

ilert stellt Agentic Incident Response vor: der Beginn der AI-first-Ära

Warum AI-first?

Lernen Sie den ilert Responder kennen: Ihren 24/7-Incident-Co-Piloten

Sehen Sie sich den ilert Responder in Aktion an

Einführung von Agentic Incident Management

Nehmen Sie am Beta-Programm für ilert Agentic Incident Response teil

AI-first-Incident-Management – für alle

Privacy-first, immer

Die Lösung für Betriebsteams.