API- und Controlpanel-Downtime bei Digital Ocean durch Löschung einer Datenbank

Am 5.April 2017 musste der amerikanische Cloud-Provider Digital Ocean eine Downtime berichten, die sich über fast drei Stunden erstreckte. Allerdings waren nur das Control Panel und API-Funktionen betroffen. Das hatte aber auch zur Folge, dass keine neuen „Droplets“ – so nennt Digital Ocean die Instanzen – generiert werden konnten oder Ressourcen verwaltet werden konnten.

Als Grund gibt Digital Ocean einen Konfigurationsfehler bei einem Testprozess an. Fatalerweise wurden wohl Zugangsdaten der produktiven Teile des Systems verwendet. Es mussten umfangreiche Datenbankinhalte aus Sicherungen  zurückgespielt werden.

Der Vorfall erinnert ein wenig an die Vorgänge bei AWS vor kurzem: Auch hier war menschliches Versagen die Ursache. Jemand hat im Zuge einer Wartung zuviele Server heruntergefahren, die für den S3-Speicherdienst eingesetzt waren.

Digital Ocean will nun reagieren und einerseits den Zugang zu den Produktivsystemen einschränken, andererseits aber auch Kapazitäten erhöhen, um im Falle von Datenrücksicherungsprozessen schneller wieder online sein zu können.

Kommentar verfassen