Railway: Eine GCP-Kontosperrung legte Railway 8 Stunden lang lahm
Am 19. Mai 2026 kam es bei Railway zu einer plattformweiten Serviceunterbrechung, die rund acht Stunden andauerte. Der SEV-1-Ausfall begann, als Google Cloud das Produktionskonto von Railway fälschlicherweise sperrte. Dadurch wurde die auf GCP gehostete Infrastruktur von Railway sofort deaktiviert – einschließlich Dashboard, API, Datenbanken, Compute-Infrastruktur und kritischer Netzwerkkomponenten. Obwohl Railway eine Multi-Cloud-Architektur über GCP, AWS und Railway Metal hinweg betreibt, weitete sich der Ausfall schnell weltweit aus. Eine versteckte Architekturabhängigkeit – eine auf GCP gehostete Netzwerk-Control-Plane – verhinderte, dass Edge-Proxys ihre Routing-Tabellen aktualisieren konnten. Sobald die zwischengespeicherten Routen abgelaufen waren, waren Kundendienste über alle Cloud-Anbieter hinweg nicht mehr erreichbar. Dieser Vorfall zeigt deutlich: Multi-Cloud-Infrastruktur garantiert keine Resilienz, wenn eine kritische Control-Plane-Abhängigkeit von einem einzelnen Anbieter abhängt.
Railway