Terintegrasi dengan Personalized Service Health

Meskipun gangguan layanan tidak dapat dihindari, komunikasi yang transparan dan awal sangat penting untuk mengevaluasi apa yang terjadi, memberi tahu pemangku kepentingan, dan melakukan tindakan untuk meminimalkan dampak pada bisnis Anda.

Mengoperasikan aplikasi cloud yang andal adalah tanggung jawab bersama antara Google Cloud dan developer aplikasi. Jika terjadi gangguan layanan,Google Cloud berupaya mengomunikasikan insiden dengan cepat dan memberikan penilaian dampak. Anda harus mengevaluasi cara menerima notifikasi, menindaklanjuti insiden yang muncul, dan mengelola dampaknya terhadap aplikasi Anda.

Personalized Service Health dapat membantu proses ini. Anda dapat berintegrasi dengannya dengan berbagai cara untuk mempelajari insiden yang muncul, mengevaluasi dampak pada aplikasi Anda, dan menerima info terbaru dari Google Cloud. Dokumen ini memberikan ringkasan tentang cara menerima sinyal gangguan layanan dariGoogle Cloud, termasuk rekomendasi tentang cara mengintegrasikannya.

Tentukan tempat untuk melakukan integrasi

Personalized Service Health memberikan tampilan yang dipersonalisasi untuk Google Cloud produk yang digunakan oleh project Anda atau di seluruh organisasi Anda. Sebaiknya lakukan integrasi dengan Kesehatan Layanan yang Dipersonalisasi untuk memberi Anda cakupan dan rentang opsi integrasi yang paling luas.

Titik integrasi Kasus penggunaan Manfaat Dependensi
Dasbor konsol (Personalized Service Health) Melihat gangguan aktif Dipersonalisasi untuk project Anda, tersedia secara default Identity and Access Management (IAM)
Google Cloud console
Pemberitahuan (Personalized Service Health) Notifikasi proaktif Dipersonalisasi untuk project Anda, praktis, dan proaktif IAM
Cloud Logging
Cloud Monitoring
API (Kesehatan Layanan yang Dipersonalisasi) Melakukan integrasi dengan sistem atau alat lain Dipersonalisasi untuk project atau organisasi Anda IAM

Memilih metode interaksi dengan Personalized Service Health

Anda harus mempertimbangkan Personalized Service Health dalam konteks operasi, pemantauan, dan model respons insiden yang Anda inginkan. Dengan mengevaluasi cara tim Anda menggunakan sinyal selama dan sebelum insiden terjadi, Anda dapat memutuskan cara Anda ingin menggunakan Personalized Service Health.

Tabel berikut menunjukkan cara Anda dapat berinteraksi dengan Kesehatan Layanan yang Dipersonalisasi, bergantung pada penyiapannya.

Contoh skenario di organisasi Anda Integrasi dengan Personalized Service Health Contoh alat yang mungkin Anda integrasikan
Developer yang bertugas untuk beberapa aplikasi Notifikasi project individual

Dasbor konsol

Google Cloud Observability, PagerDuty
Respons insiden terpusat di seluruh organisasi Integrasi API dengan sistem yang ada menggunakan OrganizationEvents API (v1, v1beta) PagerDuty, dasbor kustom
Platform internal untuk mengelola resource dan operasi cloud Service Health API
Notifikasi project individual
Integrasi Service Health API dengan platform developer internal
Backstage, Terraform
Banyak project yang dikonfigurasi dan dikelola secara terprogram (Contoh: 1.000+) Service Health API
Notifikasi otomatis berbasis API
Backstage, Terraform, PagerDuty

Menggunakan Personalized Service Health selama insiden

Setelah Anda terintegrasi dengan Personalized Service Health dan mulai mendapatkan notifikasi pemberitahuan, Personalized Service Health akan memberikan informasi tentang gangguan yang dapat membantu Anda mengelola dampaknya. Google Cloud

Mendeteksi dan menentukan cakupan insiden

Pertanyaan yang mungkin Anda ajukan pada tahap ini meliputi:

  • Apakah ini masalah yang nyata?
  • Dapatkah Anda memvalidasi dampaknya?
  • Apa saja gejalanya?
  • Pengguna, produk, atau bagian bisnis mana yang terpengaruh? Wilayah geografis mana?

Personalized Service Health membantu Anda memahami apakah masalah berasal dari project Anda atau Google, sehingga Anda dapat menerapkan respons insiden yang sesuai. Dengan alat ini, Anda dapat menemukan dan melihat informasi peristiwa sehingga Anda dapat memantau peristiwa, produk yang terpengaruh, dan lokasi yang memengaruhi project Anda.

Berikut langkah-langkah yang dapat Anda lakukan:

  1. Tinjau pemberitahuan, jika Anda telah menyiapkannya.
    • Apa yang menyebabkan pemberitahuan ini muncul?
    • Bagaimana kecocokan peringatan ini dengan semua peringatan khusus produk lainnya yang berpotensi Anda miliki?
  2. Akses dasbor Service Health untuk project atau organisasi Anda. Anda dapat melihat sekilas peristiwa, produk yang terpengaruh, dan lokasi, serta menjawab pertanyaan berikut:
    • Project Anda mana yang terpengaruh?
    • Produk mana yang menjadi dependensi project Anda yang terpengaruh?
    • Apakah peristiwa tersebut memengaruhi resource tertentu di lokasi tersebut?
  3. Tinjau peristiwa dan pahami cakupan, dampak, dan relevansinya dengan project Anda.
  4. Identifikasi peristiwa yang tampaknya terkait dengan masalah yang Anda lihat.
  5. Temukan langkah-langkah verifikasi, mitigasi (jika tersedia), dan perkiraan waktu penyelesaian untuk peristiwa tersebut.

Personalized Service Health membantu Anda meninjau status dan dampak insiden saat ini yang memengaruhi project atau organisasi Anda, sehingga Anda dapat mengelola dan meresponsnya secara efisien. Misalnya, Anda dapat memprioritaskan secara efektif dengan mengidentifikasi insiden berprioritas tertinggi secara akurat.

Memitigasi, menyelesaikan, atau meningkatkan insiden

Pertanyaan yang mungkin Anda ajukan pada tahap ini meliputi:

  • Bagaimana cara Anda mengatasi insiden tersebut?
  • Dapatkah Anda memperbaikinya secara langsung?
  • Haruskah Anda memulai failover sekarang, atau menunggu lebih lama?
  • Siapa yang harus Anda beri tahu untuk memperbaikinya?

Personalized Service Health membantu Anda memahami dampak insiden terhadap project dan resource Anda, mendapatkan informasi tentang solusi sementara yang tersedia, dan menerima info terbaru tentang perkiraan waktu penyelesaian.

Memantau progres penyelesaian insiden

Ringkasan peristiwa di dasbor Kesehatan Layanan mengidentifikasi informasi penting seperti gejala dan solusi, yang diperlukan untuk mitigasi dan menunjukkan kapan perubahan status terjadi. Dengan detail ini, Anda dapat:

  • Pantau ringkasan yang sedang berjalan terkait potensi dampak seiring perkembangan situasi.
  • Terus dapatkan info terbaru tentang perkembangan baru dan perkiraan waktu komunikasi atau info terbaru berikutnya.
  • Melihat kapan gejala dipublikasikan.
  • Lihat kapan solusi diidentifikasi.
  • Lihat saat status berubah menjadi Selesai.

Anda dapat melakukan tindakan berikut saat memantau progres:

  • Tinjau solusi, jika tersedia.
  • Terapkan respons insiden yang sesuai untuk project atau organisasi Anda.
  • Terus pantau peristiwa hingga masalahnya diatasi atau diselesaikan.

Kapan harus menghubungi Dukungan

Google mengetahui peristiwa yang muncul di dasbor Service Health. Untuk mengetahui tindakan Google terkait suatu acara, pilih acara tersebut untuk melihat detailnya.

Jika masalah tampaknya tidak tercantum dalam salah satu peristiwa di dasbor, hubungi Dukungan.

Menggunakan Personalized Service Health dengan sumber informasi insiden lainnya

Terlepas dari penyiapan perusahaan Anda, gunakan Personalized Service Health sebagai sinyal tambahan saat mengevaluasi dampak insiden. Pastikan Anda dapat meninjau beberapa sumber informasi insiden sehingga Anda dapat memutuskan langkah selanjutnya berdasarkan data dan bukti.

Alasan untuk menggunakan beberapa sumber informasi insiden mencakup:

  • Produk Google Cloud mungkin mengalami insiden di beberapa lokasi, tetapi project Anda mungkin tidak terpengaruh karena berada di lokasi yang berbeda.
  • Jika sistem penayangan Anda memiliki dua replika lengkap di zona terpisah dan produk kritis Google Cloud di satu zona gagal, Kesehatan Layanan yang Dipersonalisasi akan memberi tahu Anda tentang kegagalan tersebut. Namun, pengguna Anda mungkin tidak terpengaruh dan Anda mungkin tidak perlu segera mengambil tindakan.
  • Jika project Anda bergantung pada banyak produk Google Cloud dalam suatu lokasi, Kesehatan Layanan yang Dipersonalisasi tidak akan mengetahui:
    • Jika project Anda mengharuskan semua produk berfungsi.
    • Jika project Anda akan terus berfungsi jika salah satu produk gagal.
    • Jika seluruh aplikasi Anda terpengaruh jika satu atau beberapa produk gagal.
  • Personalized Service Health itu sendiri juga dapat mengalami penurunan kualitas atau kegagalan. Untuk memverifikasi, Anda dapat memeriksa statusnya.

Anda harus menafsirkan sinyal dari Personalized Service Health sebagaimana mestinya untuk penyiapan Anda.