Pengelolaan Insiden Google Maps Platform

Siklus proses insiden

Google Maps Platform mematuhi framework Pengelolaan Insiden Google Cloud Platform.

Saat terjadi penonaktifan atau penurunan layanan, tim teknisi produk dan tim Dukungan Google Maps Platform bekerja sama untuk mengatasi insiden tersebut dan menyampaikannya kepada Anda.

siklus proses

Deteksi

Google menggunakan pemantauan kotak hitam dan internal untuk mendeteksi insiden dan memicu peringatan kepada teknisi kami untuk investigasi. Untuk informasi selengkapnya, lihat Bab 6 dalam buku Site Reliability Engineering.

Jika Anda mendeteksi insiden yang belum dilaporkan di Issue Tracker, buka halaman Dukungan Google Maps Platform (di Google Cloud Console) lalu buat kasus dukungan baru.

Respons Awal

Saat Google mendeteksi insiden, tim Dukungan akan membuka komunikasi dengan Anda. Notifikasi awal insiden biasanya singkat, sering kali hanya menyebutkan produk yang bermasalah serta gejala utama. Itu karena kami lebih memprioritaskan notifikasi yang bersifat cepat daripada mendetail. Setelah kami mempelajari lebih lanjut, detail tambahan akan diberikan pada pemberitahuan selanjutnya.

respons

Saluran komunikasi insiden

Untuk memberikan jumlah informasi yang sesuai, tim Dukungan Google Maps Platform menawarkan saluran komunikasi insiden yang berbeda, bergantung pada cakupan dan tingkat keparahan masalah:

Dasbor Status Publik Maps adalah tempat pertama yang harus diperiksa ketika Anda menemukan masalah. Dasbor ini menampilkan insiden yang memengaruhi banyak pelanggan, jadi jika Anda melihat insiden yang tercantum, insiden tersebut kemungkinan terkait dengan masalah Anda. Untuk menunjukkan tingkat keparahan, dasbor status menandai insiden sebagai gangguan atau penonaktifan layanan. Beberapa masalah bersifat lebih ringan dan kurang berdampak, tetapi masih tersebar luas, hal ini diposting sebagai insiden informatif.

Grup Notifikasi Google Maps Platform adalah Google Grup publik tempat semua penonaktifan secara luas dilaporkan, selain info teknis lainnya tentang API Google Maps Platform. Semua anggota grup akan menerima notifikasi email saat awal penonaktifan terjadi dengan pemberitahuan selanjutnya hingga masalah teratasi.

Banner Dukungan adalah pesan informatif yang muncul di bagian Dukungan Maps pada Cloud Console saat ada insiden aktif. Pesan akan mengidentifikasi produk yang terpengaruh dan menyertakan link ke Issue Tracker.

penonaktifan

Issue Tracker berisi daftar referensi semua insiden yang diketahui. Anda dapat melihat insiden yang sedang terjadi, mengikuti progresnya dengan berlangganan, dan menambahkan komentar untuk membantu investigasi tim kami. Anda juga dapat menemukan link ke Issue Tracker publik di dokumentasi dukungan Google Maps Platform

Kasus dukungan digunakan jika masalah mungkin hanya terjadi di project Anda atau hanya berdampak ke sebagian kecil pelanggan. Jika tidak ada insiden yang dilaporkan, tetapi Anda masih mengalami masalah, buka halaman Dukungan Google Maps Platform (di Cloud Console) lalu buat kasus dukungan baru.

Investigasi

Tim teknis produk bertanggung jawab untuk menyelidiki akar penyebab insiden. Pengelolaan insiden sering kali dilakukan oleh Site Reliability Engineer, tetapi bisa dilakukan oleh software engineer atau yang lainnya, bergantung pada situasi dan produk. Untuk informasi selengkapnya, lihat Bab 12 dalam Buku Site Reliability Engineering.

Mitigasi/Perbaikan

Masalah dianggap telah diperbaiki hanya jika perubahan yang dibuat diyakini oleh Google akan meniadakan dampak yang timbul untuk selamanya. Misalnya, perbaikan dapat menghapus perubahan yang memicu insiden.

Saat insiden sedang berlangsung, tim Dukungan dan Produk akan mencoba memitigasi masalah. Mitigasi terjadi jika dampak atau cakupan masalah dapat dikurangi, misalnya dengan menyediakan resource tambahan sementara untuk layanan yang mengalami kelebihan beban.

Jika mitigasi tidak ditemukan, jika memungkinkan, tim Dukungan akan menemukan dan menyampaikan solusinya. Solusinya berupa langkah-langkah yang dapat Anda ambil untuk mengatasi kebutuhan yang mendasari, meskipun terjadi insiden. Solusi mungkin menggunakan setelan yang berbeda untuk panggilan API guna menghindari jalur kode yang bermasalah.

Tindak Lanjut

Saat insiden berlangsung, tim Dukungan akan memberikan info terbaru secara rutin. Info terbaru biasanya berupa:

  • Informasi selengkapnya tentang insiden tersebut, seperti pesan error, fitur mana yang terdampak, dan seberapa luas dampaknya.
  • Progres menuju mitigasi, termasuk semua solusinya.
  • Linimasa komunikasi, yang disesuaikan dengan insiden.
  • Perubahan status, seperti saat insiden diperbaiki.

Postmortem

Semua insiden menghasilkan analisis internal postmortem (pasca-insiden) untuk sepenuhnya memahami insiden dan mengidentifikasi peningkatan keandalan yang dapat dilakukan oleh Google. Penyempurnaan ini kemudian dilacak dan diterapkan. Untuk informasi selengkapnya tentang postmortem di Google, lihat Bab 15 dalam Buku Site Reliability Engineering.

Laporan Insiden

Saat insiden memiliki dampak yang sangat besar dan serius, Google memberikan laporan insiden yang menjelaskan gejala, dampak, penyebab utama, perbaikan, dan pencegahan insiden di masa mendatang. Seperti halnya postmortem, kami memberikan perhatian khusus pada langkah-langkah yang kami ambil untuk belajar dari masalah dan meningkatkan keandalan. Tujuan Google menulis dan merilis postmortem adalah agar transparan dan menunjukkan komitmen kami dalam membangun layanan yang stabil bagi pelanggan.

Pertanyaan Umum (FAQ)

Saya ingin diberi tahu saat terjadi penonaktifan. Apa yang harus saya lakukan?

  • Bergabunglah ke grup Notifikasi Google Maps Platform untuk mendapatkan notifikasi tentang masalah yang sedang terjadi dan mengikuti progres insiden secara real time. Grup ini juga akan membantu Anda mendapatkan informasi terbaru tentang pengumuman produk dan platform.
  • Gunakan link Feed RSS atau Histori JSON di bagian bawah Dasbor Status Publik Maps untuk melihat feed insiden yang terbaru dan terdahulu. Setiap postingan yang dikirim ke Dasbor akan memicu postingan yang dikirim ke feed. Agar Anda terus mendapatkan informasi terbaru, setiap postingan yang dikirim ke feed akan menyertakan semua pesan dan info terbaru yang terkait dengan peristiwa Dasbor yang sesuai. Dengan demikian, Anda tidak akan perlu menggali histori feed untuk mengetahui progres terkini. Feed RSS dipublikasikan dalam format XML. Ekstensi browser seperti RSS Subscription Extension (by Google) memungkinkan Anda melihat pratinjau konten feed dan berlangganan feed melalui pembaca RSS favorit. Histori JSON adalah Feed Web JSON dari insiden terdahulu. Berbagai library software dan framework web mendukung sindikasi konten melalui Feed JSON.

Jenis informasi status apa saja yang dapat saya temukan di halaman beranda dasbor?

Dasbor Status Publik Google Maps memberikan informasi status layanan yang merupakan bagian dari Google Maps Platform. Indikator status mencakup salah satu dari hal berikut ini:

  • Layanan Nonaktif: Layanan atau sistem produksi tidak aktif. Solusi tidak tersedia atau sulit diterapkan.
  • Gangguan Layanan: Layanan atau sistem produksi terganggu sebagian dan/atau tidak berfungsi seperti yang diharapkan. Solusi tersedia.
  • Insiden Ringan: Masalah berdampak rendah yang diberikan untuk tujuan informatif. Layanan masih tersedia secara umum.
  • Tersedia: Layanan berfungsi secara penuh dan bekerja seperti yang diharapkan.

Di mana saya dapat menemukan informasi tentang penonaktifan dan gangguan layanan sebelumnya?

Halaman Histori di Dasbor Status Publik Maps adalah repositori gangguan dan penonaktifan selama 365 hari terakhir. Klik insiden untuk meninjau postingan tentang insiden saat insiden tersebut masih berlangsung, serta semua laporan insiden yang dipublikasikan oleh tim Dukungan.

Siapa yang memperbarui dasbor?

Tim Dukungan Google Maps Platform global memantau status layanan menggunakan berbagai jenis sinyal yang berbeda dan akan memperbarui dasbor jika terjadi masalah yang meluas. Jika diperlukan, mereka juga akan memposting laporan analisis mendetail setelah insiden diselesaikan.

Apa perbedaan antara "insiden" dan "penonaktifan"?

Meskipun istilah ini sering digunakan secara bergantian, Dasbor Status Publik Maps dan komunikasi eksternal kami menggunakan "insiden" untuk merujuk ke periode layanan yang mengalami penurunan dan "penonaktifan" hanya untuk merujuk ke gangguan yang paling serius, yaitu saat layanan tidak berfungsi sehingga membuat pengalaman konsumen menjadi tidak berguna.