AI-First Incident Management, das funktioniert, während Sie schlafen.

AI-SRE-Agenten, die Incidents bewerten, beheben und den Status aktualisieren, während Sie die Kontrolle behalten.
Bechtle
GoInspire
Lufthansa Systems
Bertelsmann
REWE Digital
Benefits

AI-first Technologie für moderne Teams mit schnellen Reaktionszeiten

ilert ist die AI-first Incident-Management-Plattform mit KI-Funktionen über den gesamten Incident Response Lebenszyklus hinweg.

Integrationen

Starten Sie sofort mit unseren Integrationen

ilert stellt mithilfe unserer vorgefertigten Integrationen oder per E-Mail eine nahtlose Verbindung zu Ihren Tools her. Ilert lässt sich in Überwachungs-, Ticketing-, Chat- und Kollaborationstools integrieren.

Transformieren Sie Ihre Incident Response.

Kostenlos starten
Bleiben Sie auf dem Laufenden

Neues aus unserem Blog

Produkt

Wie Feiertage und Supportzeiten von ilert Teams gelassen halten

Nutzen Sie die Funktionen Supportzeiten und Feiertage von ilert, um die Kontrolle zu behalten, Burnout zu verhindern und auch in Hochphasen planbare, verlässliche Dienstpläne zu schaffen.

Daria Yankevich
Dec 01, 2025 • 5 min read

Das Jahresende setzt unter Druck. (Man kennts). Die Nachfrage steigt, die Erwartungen an Reaktionszeiten bleiben hoch, und Engineering-Teams jonglieren Produktionsprobleme, Releases und freie Tage. Für viele Teams wird der Bereitschaftsdienst genau dann chaotisch: Dienstpläne brechen, Benachrichtigungen treffen zur falschen Zeit ein, und genau dann, wenn man es sich am wenigsten leisten kann, entstehen Lücken in der Abdeckung.

Die Funktionen Feiertage und Supportzeiten von ilert wurden entwickelt, um genau das zu beheben. Sie vereinfachen das Bereitschaftsmanagement, schützen die Zeit Ihres Teams und halten Organisationen reibungslos am Laufen.

In diesem Artikel zeigen wir, wie diese Funktionen helfen, die Kontrolle zu behalten, Burnout zu verhindern und auch in den heißen Phasen planbare, verlässliche Dienstpläne zu etablieren. Und am Ende finden Sie ein praktisches Bonus-Kapitel: Wie Sie Ihre Gesundheit schützen, die Balance behalten und ohne Burnout durch die Weihnachtszeit kommen.

Jahresende – ein Crashtest für Ihre On-Call-Routine

Bereitschaftsmanagement wird kompliziert, wenn Support-Erwartungen je nach Region, Kunde oder Zeitzone variieren. Kommen Feiertage und die PTO-Saison hinzu, greifen Teams oft zu Tabellen, Slack-Pings oder „Bitte übernehmen Sie meine Schicht“-Improvisationen.

Der Betrieb zum Jahresende verlangt ohnehin höchste Konzentration. Dennoch flicken viele Teams Dienstpläne weiterhin manuell mit Tabellen, E-Mails oder Slack-Threads. Diese kleinen Improvisationen summieren sich – und ziehen Engineers und Manager weg vom Lösen der eigentlichen Probleme hinein ins administrative Feuerwehrspiel.

Die Funktion Feiertage und Supportzeiten löst das, indem sie Teams präzise automatisierte Kontrolle darüber gibt, wann Alarme ausgelöst werden sollen und wer sie bearbeitet. Das Ergebnis: weniger Unterbrechungen, sauberes Routing und Dienstpläne, die die tatsächliche Verfügbarkeit widerspiegeln.

Schauen wir uns zuerst die Funktion Supportzeiten an.

Die Supportzeiten-Funktion in ilert ermöglicht es Teams, genau festzulegen, wann Alarme ausgelöst werden sollen und wie sie anhand zeitbasierter Regeln geroutet werden. Sie fungiert als Leitlinie, die prüft, ob ein Ereignis während der Geschäftszeiten, außerhalb oder innerhalb speziell definierten Zeitfenstern stattfindet. So können Teams das Verhalten nach Dringlichkeit steuern: Kritische Incidents können rund um die Uhr eskaliert werden, während weniger schwerwiegende Themen bis zum nächsten Morgen warten können.

Supportzeiten können einfach sein (Wochentage 9–5) oder hochstrukturiert mit mehreren Blöcken, Zeitzonen und Logikschichten. Sie sind ideal für Organisationen mit unterschiedlichen SLA-Tiers, globalen Kundenstämmen oder Engineering-Teams, die Nächte und Wochenenden vor unnötigem Lärm schützen möchten.

Feiertage treiben dieses Konzept noch weiter. Intern nennen wir sie scherzhaft „Supportzeiten auf Steroiden“.

Damit können Teams nationale Feiertage, unternehmensweite freie Tage oder regionale Gedenktage automatisch aus regulären Support-Fenstern ausschließen. Anstatt Dienstpläne jedes Mal manuell anzupassen, wenn ein Feiertag ansteht, matcht ilert Ihre Servicezeiten mit dem relevanten Feiertagskalender und passt das Routing automatisch an.

Das ist besonders stark für verteilte Teams mit länderspezifischen Feiertagen – oder für alle, die schon einmal versehentlich am Weihnachtsmorgen gepaged wurden. Feiertage stellen sicher, dass Ihre Eskalationslogik die Realität widerspiegelt: weniger Überraschungen für Engineers und eine sauberere operative Abdeckung, wenn im Büro die Lichter aus sind.

Darum wird Ihnen Ihr zukünftiges Ich danken

Wir haben Supportzeiten und Feiertage aus grundlegenden Gründen etabliert. Wir erhalten täglich zahlreiche Support-Tickets, doch der Januar ist eine besondere Hochsaison – und wir verstehen die Herausforderungen, vor denen unsere Kundinnen und Kunden stehen. Kommt Ihnen davon etwas bekannt vor?

  • Lücken in der Abdeckung treten zu dem ungünstigsten Zeitpunkt auf. Wenn Engineers sich wohlverdiente freie Tage nehmen, werden diese häufig unvermeidlich – es sei denn, Dienstpläne passen sich automatisch an. Ohne diese Automatisierung verteilt sich die Last ungleich: Jemand trägt am Ende zusätzliche Bereitschaftsdienste, oder – im schlimmsten Fall – eine Ingenieurin oder ein Ingenieur wird während der Feiertage benachrichtigt. Diese Lücken schaden der Moral und verlangsamen die Incident Response direkt, dann wenn Uptime am meisten zählt.
  • Manuelle Korrekturen kosten Zeit, die Sie nicht haben. Die Jahresendarbeit verlangt ohnehin volle Konzentration, und dennoch improvisieren viele Teams mit Tabellen oder Slack-Threads, um Dienstpläne zu flicken. Diese Last-Minute-Anpassungen verbrauchen Engineering-Zeit, die besser in die Stabilisierung von Systemen, das Ausliefern von Features oder die Vorbereitung auf Traffic-Spitzen fließt – statt in die Betreuung von Kalendern.
  • Eskalationen werden laut und ungenau. Wenn Supportzeiten und Feiertage nicht vollständig in die On-Call-Logik integriert sind, werden Alarme zum falschen Zeitpunkt ausgelöst. Menschen werden außerhalb der Geschäftszeiten gepingt, oder dringende Themen rutschen unbemerkt durch. In einer Hochsaison voller Kundenaktivität eskalieren fehlgeleitete Alarme schnell zu Incidents – mit Auswirkungen auf Kundinnen und Kunden und unschönen roten Flecken auf Ihren Statusseiten.
  • Internationale Teams spüren die Komplexität noch stärker. Verteilte Teams haben es mit einem Flickenteppich aus nationalen Feiertagen, kulturellen Anlässen und regionalen Support-Regeln zu tun. Ohne ein System, das sich an den Kalender jeder Region anpasst, werden einige Teams überlastet, während andere unbeabsichtigt unterfordert sind. Dieses Ungleichgewicht wird besonders gefährlich, wenn die globale Nutzung anzieht.
  • Kundinnen und Kunden pausieren ihre Erwartungen nicht. Selbst wenn interne Teams langsamer an- oder in den Urlaub gehen, ticken SLAs weiter. Kundinnen und Kunden erwarten das gleiche Maß an Reaktionsfähigkeit – und jede Fehlanpassung zwischen Support-Verträgen und On-Call-Abdeckung wird schmerzhaft sichtbar. Schlecht gesteuerte Supportzeiten in der geschäftigsten Saison sind nicht nur lästig für Engineers – sie untergraben Vertrauen.

Bonus: 8 Tipps für Engineers im Dienst, um Burnout in der Vorweihnachtszeit zu vermeiden

  1. Verbessern Sie Ihre Alarme. Räumen Sie lärmende Monitore auf, entfernen Sie veraltete Checks und justieren Sie Schwellwerte, bevor der Traffic steigt. Ein leiseres, genaueres Alarm-Setup zahlt sich in stressigen Wochen enorm aus.
  2. Automatisieren Sie, was geht. Kleine Automatisierungen wie Log-Parser, Deployment-Skripte und Filter für Fehlermeldungs-Benachrichtigungen sparen Stunden, wenn die Alarmflut einsetzt.
  3. Nutzen Sie Rotationen sinnvoll. Stellen Sie sicher, dass On-Call-Verantwortlichkeiten fair verteilt sind und dass Feiertage korrekt abgebildet werden, damit niemand länger am Stück arbeitet, als er oder sie sollte.
  4. Proben Sie Failover und Edge-Cases. Führen Sie kurze Simulationen oder Tabletop-Übungen mit Ihrem Team durch. Zu wissen, wie sich Systeme unter Last verhalten, entfernt die Raterei, wenn echte Probleme auftreten.
  5. Konfigurieren Sie Sicherheitsnetze. Aktivieren Sie – wo sinnvoll – Auto-Remediation, stellen Sie sicher, dass Backup-Kontakte definiert sind, und prüfen Sie doppelt, dass Eskalationen korrekt geroutet werden, wenn jemand nicht verfügbar ist.
  6. Teilen Sie den Kontext proaktiv. Posten Sie kurze Updates in Slack oder Ihrem Incident-Channel zu laufenden Themen, Infrastrukturänderungen oder bekannten Risiken. Die nächste Person im Bereitschaftsdienst sollte nicht wiederentdecken müssen, was Sie bereits wissen.
  7. Verlassen Sie sich auf Ihre Tools. Funktionen wie Supportzeiten und Feiertage existieren, um die mentale Last zu reduzieren. Lassen Sie sie die schwere Arbeit übernehmen, damit Sie nicht über Dienstpläne oder Routing nachdenken müssen.
  8. Wenn ein Incident passiert, debriefen Sie schneller. Kurze, fokussierte Nachbesprechungen helfen Teams dabei Muster zügig zu lösen, ohne Stunden in Analysen zu versenken.
Produkt

Vom Signal zur Aktion mit der ilert–Ekara Integration

Verbessern Sie Ekaras Digital Experience Monitoring mit ilert und verkürzen Sie dank leistungsstarker KI-Funktionen Ihre Time-to-Resolution.

Daria Yankevich
Nov 25, 2025 • 5 min read

Moderne SRE- und IT-Operationen beruhen auf zwei Wahrheiten: Sie müssen Probleme aus der Sicht Ihrer Nutzer*innen sehen und schnell reagieren. Mit der neuen ilert–Ekara Integration verwandeln Sie Ekaras leistungsstarke Synthetic- und Real-User-Insights in umsetzbare Alarme und Incidents in ilert – geroutet an die richtige Person im Bereitschaftsdienst, mit Kontext angereichert und über Statusseiten an Stakeholder kommuniziert. Das Ergebnis: weniger Überraschungen, schnellere Wiederherstellungen und zufriedenere Nutzer*innen.

Was ist Ekara?

Ekara, entwickelt vom französischen Unternehmens ip-label, ist eine Digital Experience Monitoring Plattform, die Synthetic Monitoring (Robots) und Real User Monitoring kombiniert, um Probleme über Web, Mobile, APIs, Business-Anwendungen und Voice/IVR zu erkennen und zu diagnostizieren – verfügbar als SaaS, hybrid- oder vollständig On-Prem-Lösung. Ekara bietet No-Code Journey Scripting, Edge/Branch Monitoring sowie Optionen wie Flow AI und AI Incident Guard. Die Plattform verarbeitet täglich Milliarden von Messungen und wird von über 400 Kunden*innen in 25 Ländern eingesetzt.

Ekara wird von Unternehmen aus E-Commerce, Reise, Finanzwesen, öffentlichem Sektor und Contact Centern genutzt, um Performance so zu sehen, wie Nutzer*innen sie erleben. PVCP Group modelliert beispielsweise zentrale Buchungsstrecken, um Probleme zu erkennen, bevor sie sich negativ auf die Conversion auswirken. Contact Center und Telekommunikationsanbieter betreiben Ekaras IVR/Voice-Probes, um Call-Flows und Sprachqualität zu validieren. Hybride IT-Teams überwachen Thick-Client- und Citrix-Apps neben Web und APIs – inklusive von Edge-Standorten mithilfe des Ekara Pod. Kurz gesagt: Ekara hilft vielfältigen Teams, echte Nutzerprobleme früh zu erkennen und schnell zu handeln.

Warum Ekara mit ilert verbinden?

Ekara erkennt Probleme und sendet Alarme. ilert macht aus diesen Alarmen umsetzbare Benachrichtigungen und bringt die richtigen Personen schnell in Bewegung, wenn Vorfälle geschäftskritisch sind.

  • Schnellere Reaktion: Sobald Ekara ein Event sendet, benachrichtigt ilert das Bereitschaftsteam per Voice, SMS, Push, Slack oder Microsoft Teams. Keine manuellen Schritte, kein Rätselraten.
  • Weniger Alarmflut, klarerer Fokus: Ähnliche Alarme aus demselben Szenario oder derselben Region werden zu einem einzigen zusammengefasst. Teams beheben ein Problem – nicht mehrere Duplikate.
  • KI, die Sie schneller macht: ilert bietet leistungsstarke KI-Funktionen, die alle darauf ausgelegt sind, die Time-to-Resolution zu kürzen. ilert AI fasst eingehende Informationen zusammen, sodass Responders mit Kontext starten statt mit einer leeren Seite. Es hilft außerdem, klare Status-Updates zu verfassen und erstellt später blameless Postmortems. KI ist in jede Phase der Incident Response integriert, um manuelle Arbeit zu reduzieren und Teams schneller handlungsfähig zu machen.
  • Alle informiert halten: Mit öffentlichen und privaten Statusseiten in ilert bleiben Kunden*innen und Stakeholder jederzeit auf dem Laufenden.

Schritt-für-Schritt-Einrichtung

ilert and Ekara schema
  1. Erstellen Sie die Alarmquelle von Ekara in ilert. Kopieren Sie die Webhook-URL.
  2. Konfigurieren Sie Ekara zum Senden von Alarmen. Wählen Sie die zu übermittelnden Events: Failure, Recovery, Threshold Breach und SLO Alert.
  3. Testen und verifizieren: Lösen Sie in Ekara einen Test-Failure aus. Bestätigen Sie, dass in ilert ein Alarm erstellt wird und die aktuell im Dienstplan befindliche Person alarmiert wird.

Eine vollständige Schritt-für-Schritt-Anleitung finden Sie unter doc.ilert.com. Sollten Probleme auftreten oder Fragen bestehen, wenden Sie sich gerne an das ilert Support-Team unter support@ilert.com.

Produkt

Event Flows: Deep Dive ins Feature

Kontextbewusstes Routing mit node-basiertem Workflow: Events anreichern, bewerten und weiterleiten – bevor sie Incidents auslösen. Skalierbar und zuverlässig.

Tim Nguyen Van
Nov 07, 2025 • 5 min read

Die Verwaltung von Alarm-Routing in komplexen Umgebungen ist schwierig. Wenn Events auftreten, müssen Alarme zur richtigen Zeit die richtigen Personen erreichen, doch herkömmliche Alarmquellen stoßen bei anspruchsvollem, kontextbewusstem Routing an Grenzen. Event Flows ist ilerts node-basiertes Workflowsystem im Herzen unserer Alarmierungsinfrastruktur. Es ermöglicht intelligente Eventverarbeitung, Zeit- und kontextbasiertes Routing sowie sichere Automatisierung, sodass Teams die Alarmflut verringern und die Incident Response beschleunigen.

Die Schmerzpunkte, die Event Flows adressiert

Mit zunehmendem Monitoring-Footprint stoßen Standard-Alarmierungsmuster an ihre Grenzen. Event Flows zielt auf vier wiederkehrende Schmerzpunkte ab:

  • Komplexe Routing-Logik. Standard-Alarmquellen können nach Priorität oder Schlüsselwörtern routen, aber reale Szenarien erfordern Entscheidungen basierend auf Event-Inhalten, benutzerdefinierten Feldern, Fehler-Mustern, Kontext und Zeit. Je nach Situation werden unterschiedliche Eskalationspfade benötigt.
  • Zeitbasiertes Routing. Während der Supportzeiten gehen Alarme an die primäre Bereitschaft; außerhalb der Zeiten können sie an ein anderes Team eskalieren oder einer anderen Richtlinie folgen. Ohne Event Flows erfordert dies häufig mehrere Alarmquellen oder fragile externe Logik.
  • Kontextbewusste Entscheidungen. Dasselbe Signal kann je nach Kontext unterschiedliche Bedeutungen haben. Ein Datenbank-Verbindungsfehler kann während Spitzenzeiten kritisch sein, während er in Wartungsfenstern informativ ist. Die Reduzierung von einer Alarmflut erfordert ein Routing, das den Business Kontext bewertet.
  • Wartungsaufwand. Die Verwaltung vieler leicht unterschiedlicher Alarmquellen erhöht die operative Komplexität und das Risiko von Konfigurationsabweichungen. Ein einziger, ausdrucksstarker Workflow reduziert Duplikate.

Architektur und Integration

Event Flows sitzt zwischen Aufnahme und Alarmquellen-Routing eines Events, um eine smarte, zuverlässige Verarbeitung zu liefern. Es definiert, wie eingehende Events verarbeitet, transformiert und über eine konfigurierbare Abfolge logischer Komponenten geroutet werden. Werfen wir einen genaueren Blick auf die Schlüsselkomponenten, die Event Flows in der Praxis sowohl leistungsfähig als auch anpassungsfähig machen.

Node-basierter Flow-Builder. Ein baumstrukturierter Builder definiert Event-Verarbeitungs-Workflows. Aktuelle Node-Typen:

  • Branch: Szenarien anhand von Bedingungen erstellen.
  • Route to alert source: Events an eine spezifische Alarmquelle weiterleiten.
  • Support hours: Routing anhand vordefinierter Supportzeiten.

Warteschlangenbasierte Verarbeitung. Events, die über die ilert Event API eintreffen, werden zunächst von Event Flows verarbeitet und anschließend an Alarmquellen geroutet. Die Verarbeitung verwendet AWS SQS FIFO mit Message-Groups pro API-Key. Dies bewahrt die Reihenfolge für Events derselben Alarmquelle und verhindert Race Conditions bei nahezu Echtzeit-Verhalten.

Deterministische Ausführung. Jeder Node bewertet Bedingungen und wählt den nächsten Schritt. Der Ausführungskontext wird über Nodes hinweg beibehalten, wodurch Entscheidungen möglich sind, die auf vorherigen Berechnungen aufbauen.

Datenmodell. Ein Event Flow enthält mehrere Event Flow Nodes; jeder Node verfügt über Event Flow Branches, die Bedingungen und Ziele definieren und so den hierarchischen Ausführungspfad spiegeln.

Leistungsstarke Automatisierung mit ICL (ilert Condition Language)

Event Flows enthält eine prägnante Ausdruckssprache, die von vertrauten Programmiermustern inspiriert ist. Schreiben Sie Bedingungen, die auf Event-Daten, Kontext und Systemzustand zugreifen. Weitere Informationen zu ICL finden Sie in unserer Dokumentation.

Was ICL sehen kann

  • Event-Payload – z. B. event.priority, event.summary, event.source, benutzerdefinierte Felder
  • Zeitkontext – Geschäftszeiten, Wochenenden, Wartungsfenster
  • Akkumulierter Kontext – Werte, die von früheren Nodes geschrieben wurden

Beispiele

Nach Priorität routen: 

Text sicher abgleichen:

Zeitbasiertes Routing mit hilfe von Supportzeiten:

Mehrere Checks kombinieren:

Fazit

Event Flows bringt intelligentes, kontextbewusstes Routing in ilerts Alarmierungs-Stack. Mit einem node-basierten Builder und der ilert Condition Language (ICL) für erweiterte Logik können Teams Events anreichern und routen, bevor sie zu Alarmen werden. Starke Zuverlässigkeit Garantien sorgen für weniger Alarmrauschen, weniger Fehl Routings und schnellere, mehr konsistente Reaktionen.

Alle entdecken
Danke! Deine Einreichung ist eingegangen!
Hoppla! Beim Absenden des Formulars ist etwas schief gelaufen.
Unsere Cookie-Richtlinie
Wir verwenden Cookies, um Ihre Erfahrung zu verbessern, den Seitenverkehr zu verbessern und für Marketingzwecke. Erfahren Sie mehr in unserem Datenschutzrichtlinie.
Open Preferences
Danke! Deine Einreichung ist eingegangen!
Hoppla! Beim Absenden des Formulars ist etwas schief gelaufen.
Danke! Deine Einreichung ist eingegangen!
Hoppla! Beim Absenden des Formulars ist etwas schief gelaufen.
Danke! Deine Einreichung ist eingegangen!
Hoppla! Beim Absenden des Formulars ist etwas schief gelaufen.