Meskipun gangguan layanan tidak dapat dihindari, komunikasi yang transparan dan awal sangat penting untuk mengevaluasi apa yang terjadi, memberi tahu pemangku kepentingan, dan melakukan tindakan untuk meminimalkan dampak pada bisnis Anda.
Mengoperasikan aplikasi cloud yang andal adalah tanggung jawab bersama antara Google Cloud dan developer aplikasi. Jika terjadi gangguan layanan,Google Cloud berupaya mengomunikasikan insiden dengan cepat dan memberikan penilaian dampak. Anda harus mengevaluasi cara menerima notifikasi, menindaklanjuti insiden yang muncul, dan mengelola dampaknya terhadap aplikasi Anda.
Personalized Service Health dapat membantu proses ini. Anda dapat berintegrasi dengannya dengan berbagai cara untuk mempelajari insiden yang muncul, mengevaluasi dampak pada aplikasi Anda, dan menerima info terbaru dari Google Cloud. Dokumen ini memberikan ringkasan tentang cara menerima sinyal gangguan layanan dariGoogle Cloud, termasuk rekomendasi tentang cara mengintegrasikannya.
Tentukan tempat untuk melakukan integrasi
Personalized Service Health memberikan tampilan yang dipersonalisasi untuk Google Cloud produk yang digunakan oleh project Anda atau di seluruh organisasi Anda. Sebaiknya lakukan integrasi dengan Kesehatan Layanan yang Dipersonalisasi untuk memberi Anda cakupan dan rentang opsi integrasi yang paling luas.
Titik integrasi | Kasus penggunaan | Manfaat | Dependensi |
Dasbor konsol (Personalized Service Health) | Melihat gangguan aktif | Dipersonalisasi untuk project Anda, tersedia secara default | Identity and Access Management (IAM) Google Cloud console |
Pemberitahuan (Personalized Service Health) | Notifikasi proaktif | Dipersonalisasi untuk project Anda, praktis, dan proaktif | IAM Cloud Logging Cloud Monitoring |
API (Kesehatan Layanan yang Dipersonalisasi) | Melakukan integrasi dengan sistem atau alat lain | Dipersonalisasi untuk project atau organisasi Anda | IAM |
Memilih metode interaksi dengan Personalized Service Health
Anda harus mempertimbangkan Personalized Service Health dalam konteks operasi, pemantauan, dan model respons insiden yang Anda inginkan. Dengan mengevaluasi cara tim Anda menggunakan sinyal selama dan sebelum insiden terjadi, Anda dapat memutuskan cara Anda ingin menggunakan Personalized Service Health.
Tabel berikut menunjukkan cara Anda dapat berinteraksi dengan Kesehatan Layanan yang Dipersonalisasi, bergantung pada penyiapannya.
Contoh skenario di organisasi Anda | Integrasi dengan Personalized Service Health | Contoh alat yang mungkin Anda integrasikan |
Developer yang bertugas untuk beberapa aplikasi | Notifikasi project individual
Dasbor konsol |
Google Cloud Observability, PagerDuty |
Respons insiden terpusat di seluruh organisasi | Integrasi API dengan sistem yang ada menggunakan OrganizationEvents API (v1, v1beta) | PagerDuty, dasbor kustom |
Platform internal untuk mengelola resource dan operasi cloud | Service Health API Notifikasi project individual Integrasi Service Health API dengan platform developer internal |
Backstage, Terraform |
Banyak project yang dikonfigurasi dan dikelola secara terprogram (Contoh: 1.000+) | Service Health API Notifikasi otomatis berbasis API |
Backstage, Terraform, PagerDuty |
Menggunakan Personalized Service Health selama insiden
Setelah Anda terintegrasi dengan Personalized Service Health dan mulai mendapatkan notifikasi pemberitahuan, Personalized Service Health akan memberikan informasi tentang gangguan yang dapat membantu Anda mengelola dampaknya. Google Cloud
Mendeteksi dan menentukan cakupan insiden
Pertanyaan yang mungkin Anda ajukan pada tahap ini meliputi:
- Apakah ini masalah yang nyata?
- Dapatkah Anda memvalidasi dampaknya?
- Apa saja gejalanya?
- Pengguna, produk, atau bagian bisnis mana yang terpengaruh? Wilayah geografis mana?
Personalized Service Health membantu Anda memahami apakah masalah berasal dari project Anda atau Google, sehingga Anda dapat menerapkan respons insiden yang sesuai. Dengan alat ini, Anda dapat menemukan dan melihat informasi peristiwa sehingga Anda dapat memantau peristiwa, produk yang terpengaruh, dan lokasi yang memengaruhi project Anda.
Berikut langkah-langkah yang dapat Anda lakukan:
- Tinjau pemberitahuan, jika Anda telah menyiapkannya.
- Apa yang menyebabkan pemberitahuan ini muncul?
- Bagaimana kecocokan peringatan ini dengan semua peringatan khusus produk lainnya yang berpotensi Anda miliki?
- Akses dasbor Service Health untuk project atau organisasi Anda. Anda dapat melihat sekilas peristiwa, produk yang terpengaruh, dan lokasi, serta menjawab pertanyaan berikut:
- Project Anda mana yang terpengaruh?
- Produk mana yang menjadi dependensi project Anda yang terpengaruh?
- Apakah peristiwa tersebut memengaruhi resource tertentu di lokasi tersebut?
- Tinjau peristiwa dan pahami cakupan, dampak, dan relevansinya dengan project Anda.
- Identifikasi peristiwa yang tampaknya terkait dengan masalah yang Anda lihat.
- Temukan langkah-langkah verifikasi, mitigasi (jika tersedia), dan perkiraan waktu penyelesaian untuk peristiwa tersebut.
Personalized Service Health membantu Anda meninjau status dan dampak insiden saat ini yang memengaruhi project atau organisasi Anda, sehingga Anda dapat mengelola dan meresponsnya secara efisien. Misalnya, Anda dapat memprioritaskan secara efektif dengan mengidentifikasi insiden berprioritas tertinggi secara akurat.
Memitigasi, menyelesaikan, atau meningkatkan insiden
Pertanyaan yang mungkin Anda ajukan pada tahap ini meliputi:
- Bagaimana cara Anda mengatasi insiden tersebut?
- Dapatkah Anda memperbaikinya secara langsung?
- Haruskah Anda memulai failover sekarang, atau menunggu lebih lama?
- Siapa yang harus Anda beri tahu untuk memperbaikinya?
Personalized Service Health membantu Anda memahami dampak insiden terhadap project dan resource Anda, mendapatkan informasi tentang solusi sementara yang tersedia, dan menerima info terbaru tentang perkiraan waktu penyelesaian.
Memantau progres penyelesaian insiden
Ringkasan peristiwa di dasbor Kesehatan Layanan mengidentifikasi informasi penting seperti gejala dan solusi, yang diperlukan untuk mitigasi dan menunjukkan kapan perubahan status terjadi. Dengan detail ini, Anda dapat:
- Pantau ringkasan yang sedang berjalan terkait potensi dampak seiring perkembangan situasi.
- Terus dapatkan info terbaru tentang perkembangan baru dan perkiraan waktu komunikasi atau info terbaru berikutnya.
- Melihat kapan gejala dipublikasikan.
- Lihat kapan solusi diidentifikasi.
- Lihat saat status berubah menjadi Selesai.
Anda dapat melakukan tindakan berikut saat memantau progres:
- Tinjau solusi, jika tersedia.
- Terapkan respons insiden yang sesuai untuk project atau organisasi Anda.
- Terus pantau peristiwa hingga masalahnya diatasi atau diselesaikan.
Kapan harus menghubungi Dukungan
Google mengetahui peristiwa yang muncul di dasbor Service Health. Untuk mengetahui tindakan Google terkait suatu acara, pilih acara tersebut untuk melihat detailnya.
Jika masalah tampaknya tidak tercantum dalam salah satu peristiwa di dasbor, hubungi Dukungan.
Menggunakan Personalized Service Health dengan sumber informasi insiden lainnya
Terlepas dari penyiapan perusahaan Anda, gunakan Personalized Service Health sebagai sinyal tambahan saat mengevaluasi dampak insiden. Pastikan Anda dapat meninjau beberapa sumber informasi insiden sehingga Anda dapat memutuskan langkah selanjutnya berdasarkan data dan bukti.
Alasan untuk menggunakan beberapa sumber informasi insiden mencakup:
- Produk Google Cloud mungkin mengalami insiden di beberapa lokasi, tetapi project Anda mungkin tidak terpengaruh karena berada di lokasi yang berbeda.
- Jika sistem penayangan Anda memiliki dua replika lengkap di zona terpisah dan produk kritis Google Cloud di satu zona gagal, Kesehatan Layanan yang Dipersonalisasi akan memberi tahu Anda tentang kegagalan tersebut. Namun, pengguna Anda mungkin tidak terpengaruh dan Anda mungkin tidak perlu segera mengambil tindakan.
- Jika project Anda bergantung pada banyak produk Google Cloud dalam suatu lokasi, Kesehatan Layanan yang Dipersonalisasi tidak akan mengetahui:
- Jika project Anda mengharuskan semua produk berfungsi.
- Jika project Anda akan terus berfungsi jika salah satu produk gagal.
- Jika seluruh aplikasi Anda terpengaruh jika satu atau beberapa produk gagal.
- Personalized Service Health itu sendiri juga dapat mengalami penurunan kualitas atau kegagalan. Untuk memverifikasi, Anda dapat memeriksa statusnya.
Anda harus menafsirkan sinyal dari Personalized Service Health sebagaimana mestinya untuk penyiapan Anda.