Google Maps Platform – Vorfallmanagement

Kommunikationskanäle bei Vorfällen

Das Google Maps Platform-Supportteam ist bei Vorfällen über verschiedene Kommunikationskanäle erreichbar.

In der Problemverfolgung für Google Maps Platform-Vorfälle und -Ausfälle werden alle bekannten Vorfälle aufgeführt. Du kannst dir ganz einfach aktuelle Vorfälle ansehen, ihren Fortschritt verfolgen und Kommentare erstellen, um unsere Teams bei ihren Untersuchungen zu unterstützen, indem du das Problem abonnierst.

In der Gruppe „Google Maps Platform Notifications“ werden weit verbreitete Ausfälle zuerst gemeldet. Alle Kunden, die der Gruppe beitreten, werden per E-Mail über neu erkannte Ausfälle informiert und erhalten danach Aktualisierungen, bis das Problem behoben ist.

Sobald ein Problem erkannt und in der Problemverfolgung gemeldet wird, wird auch ein entsprechendes Banner auf der Supportseite der Google Maps Platform eingeblendet. Dieses Banner enthält Informationen zum betroffenen Produkt und einen Link zur Problemverfolgung.

Lebenszyklus eines Vorfalls

Die Google Maps Platform entspricht den Anforderungen des Google Cloud Platform-Frameworks für das Vorfallmanagement.

Wenn ein Dienst ausfällt oder beeinträchtigt wird, arbeiten das Produkttechnikteam und das Google Maps Platform-Supportteam zusammen, um den Vorfall zu beheben und dich darüber zu informieren.

Lebenszyklus

Erkennung

Google verwendet internes Monitoring und Blackbox-Monitoring, um Vorfälle zu erkennen. Weitere Informationen findest du in Kapitel 6 des Buches „Site Reliability Engineering“.

Wenn du einen Vorfall entdeckst, der noch nicht in der Problemverfolgung gemeldet wurde, rufe die Supportseite der Google Maps Platform (in der Cloud Console) auf und erstelle einen neuen Supportfall.

Erste Antwort

Wenn ein Vorfall erkannt wird, übernimmt das Supportteam die Kommunikation mit dir. Die erste Benachrichtigung über einen Vorfall ist knapp, oft wird lediglich das betreffende Produkt genannt. Dies liegt daran, dass wir eine schnelle Benachrichtigung gegenüber einer detailreichen vorziehen. Details werden bei nachfolgenden Aktualisierungen bereitgestellt.

Damit das richtige Ausmaß an Informationen bereitgestellt werden kann, werden je nach Umfang und Schweregrad eines Problems verschiedene Kommunikationskanäle genutzt.

Antwort

Prüfung

Produktentwicklungsteams sind dafür verantwortlich, nach der Ursache von Vorfällen zu suchen. Das Vorfallmanagement wird oft von Customer Reliability Engineering-Mitarbeitern abgewickelt, kann jedoch je nach Situation und Produkt auch von Softwareentwicklern oder anderen Personen übernommen werden. Weitere Informationen findest du in Kapitel 12 des Buches „Site Reliability Engineering“.

Entschärfung/Behebung

Ein Problem gilt erst dann als behoben, wenn Änderungen vorgenommen wurden, von denen Google überzeugt ist, dass sie die Auswirkungen auf unbestimmte Zeit beenden. Zur Problembehebung könnte beispielsweise eine Änderung rückgängig gemacht werden, die einen Vorfall ausgelöst hat.

Während eines Vorfalls versuchen das Support- und das Produktteam, das Problem abzuschwächen, sodass weniger Kunden dadurch beeinträchtigt werden oder die Beeinträchtigung nicht so schwerwiegend ist. Eine Möglichkeit, dies zu erreichen, wäre beispielsweise die vorübergehende Bereitstellung zusätzlicher Ressourcen, wenn ein Dienst überlastet ist.

Wenn keine Lösung zur Entschärfung gefunden wurde, eruiert das Supportteam nach Möglichkeit Problemumgehungen und kommuniziert diese. Problemumgehungen sind Maßnahmen, die du ergreifen kannst, um das zugrunde liegende Problem trotz des Vorfalls zu lösen. Eine Problemumgehung könnte in der Verwendung anderer Einstellungen für einen API-Aufruf bestehen, um einen problematischen Codepfad zu vermeiden.

Follow-up

Während eines Vorfalls stellt das Supportteam regelmäßig Aktualisierungen bereit. Diese enthalten normalerweise Folgendes:

  • Weitere Informationen zum Vorfall, etwa Fehlermeldungen, betroffene Funktionen und Ausmaß der Verbreitung
  • Fortschritt in Bezug auf die Entschärfung, einschließlich Problemumgehungen
  • Zeitpläne für die Kommunikation, zugeschnitten auf den Vorfall
  • Statusänderungen, z. B. wenn ein Vorfall behoben ist

Postmortem

Nach jedem Vorfall findet ein sogenanntes Postmortem statt. Diese interne Analyse dient dazu, den Vorfall vollständig zu verstehen und zu bestimmen, wie Google die Zuverlässigkeit verbessern kann. Diese Verbesserungen werden dann erfasst und zum Schluss implementiert. Weitere Informationen zu Postmortems bei Google findest du in Kapitel 15 des Buches „Site Reliability Engineering“.

Vorfallbericht

Wenn Vorfälle sehr weitreichende und schwerwiegende Auswirkungen haben, stellt Google Vorfallberichte bereit, in denen Symptome, Auswirkungen, Ursachen, Problembehebungen und Möglichkeiten zur künftigen Vermeidung von Vorfällen beschrieben werden. Wie bei Postmortems achten wir besonders auf die Maßnahmen, die wir ergreifen, um aus dem Problem zu lernen und die Zuverlässigkeit zu verbessern. Google verfasst und veröffentlicht Postmortems mit dem Ziel, Transparenz zu zeigen und unser Engagement für die Entwicklung stabiler Dienste für unsere Kunden zu demonstrieren.

FAQ

Ich möchte über aktuelle Ausfälle benachrichtigt werden. Was soll ich tun?

Tritt der Gruppe „Google Maps Platform Notifications“ bei, um über aktuelle Probleme informiert zu werden und den Fortschritt von Vorfällen in Echtzeit zu verfolgen. Als Mitglied dieser Gruppe erhältst du auch immer die neuesten Produkt- und Plattformankündigungen.

Wo kann ich nachsehen, ob ein Ausfall gemeldet wurde?

Das Google Maps Platform-Team bietet dir verschiedene Ressourcen, mit denen du in Bezug auf aktuelle Ausfälle auf dem neuesten Stand bleiben kannst. Wähle die Option aus, die für dich am besten passt.

  • Vorfälle in der Problemverfolgung: Hier werden alle bekannten Vorfälle aufgeführt. Du kannst dir ganz einfach aktuelle Vorfälle ansehen, ihren Fortschritt verfolgen, indem du sie abonnierst, und Kommentare erstellen, um unsere Teams bei ihren Untersuchungen zu unterstützen. Den Link zur öffentlichen Problemverfolgung findest du in der Supportdokumentation für die Google Maps Platform.
  • Google Maps Platform Notifications: In dieser Google-Gruppe werden alle weit verbreiteten Ausfälle gemeldet. Alle Kunden, die der Gruppe beitreten, werden per E-Mail über neu erkannte Ausfälle informiert und erhalten danach Aktualisierungen, bis das Problem behoben ist.
  • Google Maps Platform-Supportseite (in der Cloud Console): Sobald ein Problem erkannt und in der Problemverfolgung gemeldet wurde, wird auf der Supportseite ein aktives Banner eingeblendet. Dieses enthält einen Hinweis zum Problem und einen Link zur Problemverfolgung.

    Ausfall

Wie gehe ich vor, wenn mein Problem nicht in der Benachrichtigungsgruppe oder in der Problemverfolgung aufgeführt ist?

Es kann sein, dass das Problem nur deine Projekte oder nur eine begrenzte Anzahl von Kunden betrifft. Wenn kein Vorfall gemeldet wurde, rufe die Supportseite der Google Maps Platform (in der Cloud Console) auf und erstelle einen neuen Supportfall.

Was ist der Unterschied zwischen einem „Vorfall“ und einem „Ausfall“?

Auch wenn diese Begriffe häufig gleichbedeutend verwendet werden, gelten bei unserer externen Kommunikation folgende Definitionen: Ein „Vorfall“ liegt vor, wenn der Dienst über eine gewisse Zeit nur eingeschränkt verfügbar ist. Von einem „Ausfall“ sprechen wir nur bei einem schwerwiegenden Problem, bei dem ein Produkt größtenteils nicht funktioniert.