Dienstunterbrechungen sind zwar unvermeidlich, aber eine transparente und frühzeitige Kommunikation ist unerlässlich, um zu bewerten, was passiert, Ihre Stakeholder auf dem Laufenden zu halten und Maßnahmen zu ergreifen, um die Auswirkungen auf Ihr Unternehmen zu minimieren.
Der Betrieb einer zuverlässigen Cloud-Anwendung ist eine gemeinsame Verantwortung vonGoogle Cloud und Anwendungsentwicklern. Bei einer Dienstunterbrechung informiertGoogle Cloud schnell über den Vorfall und stellt eine Folgenabschätzung bereit. Sie müssen festlegen, wie Sie Benachrichtigungen erhalten, auf neue Vorfälle reagieren und die Auswirkungen auf Ihre Anwendung verwalten.
Personalized Service Health kann Sie dabei unterstützen. Sie können die API auf verschiedene Arten einbinden, um über neue Vorfälle informiert zu werden, die Auswirkungen auf Ihre Anwendungen zu bewerten und Updates von Google Cloudzu erhalten. In diesem Dokument finden Sie einen Überblick darüber, wie Sie Signale für Dienstunterbrechungen vonGoogle Clouderhalten, sowie Empfehlungen für die Integration.
Entscheiden, wo die Integration erfolgen soll
Personalized Service Health bietet eine personalisierte Ansicht der Google Cloud -Produkte, die von Ihren Projekten oder in Ihrer gesamten Organisation verwendet werden. Wir empfehlen die Integration mit Personalized Service Health, da Sie so die meisten Abdeckungs- und Integrationsoptionen erhalten.
Integrationspunkt | Anwendungsfall | Vorteile | Abhängigkeiten |
Console-Dashboard (Personalized Service Health) | Aktive Unterbrechungen ansehen | Standardmäßig verfügbar und auf Ihre Projekte zugeschnitten | Identity and Access Management (IAM) Google Cloud console |
Benachrichtigungen (Personalized Service Health) | Proaktive Benachrichtigungen | Auf Ihre Projekte zugeschnitten, praktisch und proaktiv | IAM Cloud Logging Cloud Monitoring |
API (Personalized Service Health) | In ein anderes System oder Tool einbinden | Auf Ihre Projekte oder Organisation zugeschnitten | IAM |
Methode für die Interaktion mit Personalized Service Health auswählen
Sie müssen Personalized Service Health im Kontext Ihres beabsichtigten Betriebs-, Monitoring- und Vorfallreaktionsmodells berücksichtigen. Wenn Sie analysieren, wie Ihre Teams Signale während und vor Vorfällen verwenden, können Sie entscheiden, wie Sie Personalized Service Health nutzen möchten.
In der folgenden Tabelle sehen Sie, wie Sie mit der personalisierten Dienstintegrität interagieren können, je nachdem, wie sie eingerichtet ist.
Beispielszenario in Ihrer Organisation | Integration mit Personalized Service Health | Beispieltools, die Sie möglicherweise einbinden |
Entwickler, die für einige Anwendungen Rufbereitschaft haben | Benachrichtigungen zu einzelnen Projekten
Konsolen-Dashboard |
Google Cloud Observability, PagerDuty |
Zentrale Reaktion auf Vorfälle in einer Organisation | API-Integration in das vorhandene System mit der OrganizationEvents API (v1, v1beta) | PagerDuty, benutzerdefinierte Dashboards |
Interne Plattform zum Verwalten von Cloud-Ressourcen und ‑Vorgängen | Service Health API Benachrichtigungen für einzelne Projekte Service Health API-Integration in eine interne Entwicklerplattform |
Backstage, Terraform |
Viele programmatisch konfigurierte und verwaltete Projekte (z. B. 1.000 oder mehr) | Service Health API Automatisierte API-basierte Benachrichtigungen |
Backstage, Terraform, PagerDuty |
Personalized Service Health während eines Vorfalls verwenden
Nachdem Sie Personalized Service Health integriert haben und Benachrichtigungen erhalten, werden Ihnen Informationen zu Google Cloud-Störungen bereitgestellt, mit denen Sie die Auswirkungen besser bewältigen können.
Vorfall erkennen und eingrenzen
In dieser Phase können Sie unter anderem folgende Fragen stellen:
- Ist es ein echtes Problem?
- Können Sie die Auswirkungen bestätigen?
- Was sind die Symptome?
- Welche Nutzer, Produkte oder Teile des Unternehmens sind betroffen? Welche Regionen?
Mit Personalized Service Health können Sie feststellen, ob das Problem in Ihrem Projekt oder bei Google auftritt, damit Sie die entsprechenden Maßnahmen zur Reaktion auf Vorfälle ergreifen können. Sie können Ereignisinformationen suchen und ansehen, um das Ereignis, die betroffenen Produkte und die Orte zu überwachen, die sich auf Ihr Projekt auswirken.
So können Sie vorgehen:
- Sehen Sie sich die Benachrichtigung an, falls Sie sie eingerichtet haben.
- Was hat diese Benachrichtigung ausgelöst?
- Wie passen diese Benachrichtigungen zu allen anderen potenziell produktspezifischen Benachrichtigungen?
- Rufen Sie das Dashboard „Service Health“ für Ihr Projekt oder Ihre Organisation auf. Sie können Ereignisse, betroffene Produkte und Standorte auf einen Blick sehen und die folgenden Fragen beantworten:
- Welche Ihrer Projekte sind betroffen?
- Welche Produkte, von denen Ihr Projekt abhängt, sind betroffen?
- Betrifft das Ereignis bestimmte Ressourcen an diesen Standorten?
- Sehen Sie sich die Ereignisse an und machen Sie sich ein Bild von ihrem Umfang, ihren Auswirkungen und ihrer Relevanz für Ihr Projekt.
- Suchen Sie nach einem Ereignis, das mit dem Problem zusammenhängen könnte.
- Hier finden Sie die Bestätigungsschritte, die Maßnahmen (falls verfügbar) und die voraussichtliche Bearbeitungszeit für das Ereignis.
Mit Personalized Service Health können Sie den aktuellen Status und die Auswirkungen von Vorfällen, die sich auf Ihr Projekt oder Ihre Organisation auswirken, überprüfen, damit Sie diese effizient verwalten und darauf reagieren können. Sie können beispielsweise effektiv priorisieren, indem Sie den Vorfall mit der höchsten Priorität genau identifizieren.
Vorfall abmildern, beheben oder eskalieren
In dieser Phase können Sie unter anderem folgende Fragen stellen:
- Wie können Sie das Problem umgehen?
- Können Sie das Problem direkt beheben?
- Sollten Sie jetzt ein Failover initiieren oder noch warten?
- Wen sollten Sie benachrichtigen, um das Problem zu beheben?
Personalized Service Health hilft Ihnen, die Auswirkungen eines Vorfalls auf Ihre Projekte und Ressourcen zu verstehen, sich über verfügbare Problemumgehungen zu informieren und Updates zur geschätzten Lösungszeit zu erhalten.
Fortschritt bei der Behebung von Vorfällen beobachten
Die Ereignisübersicht im Service Health-Dashboard enthält wichtige Informationen wie Symptome und Problemumgehungen, die für die Problembehebung erforderlich sind, und zeigt an, wann sich der Status ändert. Mit diesen Informationen können Sie:
- Sie können eine laufende Zusammenfassung der potenziellen Auswirkungen im Blick behalten, während sich die Situation entwickelt.
- Bleiben Sie über alle neuen Entwicklungen und den voraussichtlichen Zeitpunkt der nächsten Mitteilung oder Aktualisierung auf dem Laufenden.
- Sehen, wann ein Symptom veröffentlicht wurde.
- Hier erfahren Sie, wann eine Problemumgehung gefunden wurde.
- Sehen Sie nach, wann sich der Status in Behoben ändert.
Während Sie den Fortschritt beobachten, können Sie die folgenden Aktionen ausführen:
- Sehen Sie sich die Behelfslösungen an, sofern verfügbar.
- Implementieren Sie die für Ihr Projekt oder Ihre Organisation geeignete Reaktion auf Vorfälle.
- Behalten Sie das Ereignis im Blick, bis es behoben oder gelöst ist.
Wann Sie den Support kontaktieren sollten
Google ist sich der Ereignisse bewusst, die im Service Health-Dashboard angezeigt werden. Wenn Sie wissen möchten, was Google in Bezug auf ein Ereignis unternimmt, wählen Sie es aus, um die Details aufzurufen.
Wenn ein Problem nicht in den Ereignissen im Dashboard enthalten ist, wenden Sie sich an den Support.
Personalized Service Health mit anderen Quellen für Vorfallinformationen verwenden
Unabhängig von der Einrichtung Ihres Unternehmens sollten Sie Personalized Service Health als zusätzliches Signal verwenden, wenn Sie die Auswirkungen von Vorfällen bewerten. Sie sollten mehrere Quellen für Vorfallinformationen einsehen können, damit Sie auf Grundlage von Daten und Beweisen über die nächsten Schritte entscheiden können.
Gründe für die Verwendung mehrerer Quellen für Vorfallinformationen:
- Ein Google Cloud Produkt ist möglicherweise an einem bestimmten Standort von einem Vorfall betroffen, Ihre Projekte jedoch nicht, da sie sich an einem anderen Standort befinden.
- Wenn Ihr Bereitstellungssystem zwei vollständige Replikate in separaten Zonen hat und ein Google Cloud kritisches Produkt in einer Zone ausfällt, werden Sie über Personalized Service Health über diesen Ausfall informiert. Es kann jedoch sein, dass Ihre Nutzer nicht betroffen sind und Sie keine sofortigen Maßnahmen ergreifen müssen.
- Wenn Ihr Projekt von vielen Google Cloud Produkten an einem Standort abhängt, kann Personalized Service Health Folgendes nicht erkennen:
- Wenn Ihr Projekt erfordert, dass alle Produkte funktionsfähig sind.
- Wenn Ihr Projekt auch dann weiter funktioniert, wenn ein Produkt ausfällt.
- Wenn Ihre gesamte Anwendung betroffen ist, wenn eines oder mehrere der Produkte ausfallen.
- Auch Personalized Service Health selbst kann beeinträchtigt sein oder ausfallen. Prüfen Sie den Status, um dies zu bestätigen.
Sie müssen Signale aus Personalized Service Health entsprechend Ihrer Einrichtung interpretieren.