การจัดการเหตุการณ์ของ Google Maps Platform

วงจรเหตุการณ์

Google Maps Platform ปฏิบัติตามเฟรมเวิร์กการจัดการเหตุการณ์ของ Google Cloud Platform

เมื่อเกิดเหตุไฟฟ้าขัดข้องหรือบริการลดลง ทีมวิศวกรผลิตภัณฑ์และทีมสนับสนุนของ Google Maps Platform จะทํางานร่วมกันเพื่อแก้ไขปัญหาและแจ้งให้คุณทราบ

วงจร

การตรวจจับ

Google ใช้การตรวจสอบภายในและกล่องดําในการตรวจจับเหตุการณ์และส่งการแจ้งเตือนไปยังวิศวกรของเราเพื่อตรวจสอบ ดูข้อมูลเพิ่มเติมได้ที่บทที่ 6 ของหนังสือเกี่ยวกับวิศวกรรมความน่าเชื่อถือของเว็บไซต์

หากคุณตรวจพบเหตุการณ์ที่ยังไม่ได้รายงานในเครื่องมือติดตามปัญหา ให้ไปที่หน้าการสร้างเคสขอรับความช่วยเหลือของ Google Maps Platform (ใน Google Cloud Console) และสร้างเคสขอรับความช่วยเหลือใหม่

คําตอบเบื้องต้น

เมื่อ Google ตรวจพบเหตุการณ์ ทีมสนับสนุนจะสื่อสารกับคุณ การแจ้งเตือนเหตุการณ์เบื้องต้นมักมีจํานวนน้อย โดยมักพูดถึงผลิตภัณฑ์ที่เป็นปัญหาพร้อมกับอาการหลักๆ เท่านั้น เนื่องจากเราให้ความสําคัญกับการแจ้งเตือนที่รวดเร็วก่อนรายละเอียด ในระหว่างที่เราดูรายละเอียดเพิ่มเติม เราจะแจ้งรายละเอียดเพิ่มเติมให้คุณทราบในภายหลัง

การตอบ

ช่องทางการสื่อสารสําหรับเหตุการณ์

ทีมสนับสนุนของ Google Maps Platform มีช่องทางการสื่อสารเกี่ยวกับเหตุการณ์ที่แตกต่างกันเพื่อให้ข้อมูลในปริมาณที่เหมาะสม โดยขึ้นอยู่กับขอบเขตและความรุนแรงของปัญหา

หน้าแดชบอร์ดสถานะสาธารณะของ Maps เป็นที่แรกที่คุณควรตรวจสอบเมื่อพบปัญหาที่ส่งผลกระทบต่อคุณ หน้าแดชบอร์ดจะแสดงเหตุการณ์ที่ส่งผลกระทบต่อลูกค้าหลายราย ดังนั้นหากคุณเห็นเหตุการณ์ที่แสดงอยู่ ปัญหานี้น่าจะเกี่ยวข้องกับปัญหาของคุณ หน้าแดชบอร์ดสถานะจะทําเครื่องหมายเหตุการณ์เป็นการหยุดทํางาน ข้อขัดข้อง หรือข้อมูล เพื่อระบุถึงความรุนแรง

กลุ่มการแจ้งเตือนของ Google Maps Platform เป็นกลุ่ม Google สาธารณะที่มีการรายงานการหยุดทํางานที่เกิดขึ้นบ่อยที่สุด นอกเหนือจากการอัปเดตทางเทคนิคอื่นๆ เกี่ยวกับ Google Maps Platform API สมาชิกกลุ่มทุกคนจะได้รับการแจ้งเตือนทางอีเมลเมื่อตรวจพบการหยุดทํางานพร้อมการอัปเดตในภายหลัง จนกว่าปัญหาจะได้รับการแก้ไข

การ์ดสถานะของ Maps Platform คือข้อความข้อมูลที่มองเห็นได้อยู่เสมอในส่วนการสนับสนุนของ Maps ของ Cloud Console โดยแสดงสถานะปัจจุบันของ Maps API และบริการ เมื่อมีเหตุการณ์ที่ดําเนินอยู่ ระบบจะแสดงข้อความระบุผลิตภัณฑ์ที่ได้รับผลกระทบพร้อมแนบลิงก์ไปยังหน้าแดชบอร์ดสถานะสาธารณะของ Maps ซึ่งคุณจะเห็นเหตุการณ์ดังกล่าว

การหยุดทํางาน

เครื่องมือติดตามปัญหา มีรายการอ้างอิงเหตุการณ์ที่รู้จักทั้งหมด คุณสามารถดูเหตุการณ์ที่เปิดอยู่ ติดตามความคืบหน้า โดยติดตามเหตุการณ์เหล่านั้น และเพิ่มความคิดเห็นเพื่อช่วยให้ทีมของเราตรวจสอบได้ นอกจากนี้ คุณยังดูลิงก์ไปยังเครื่องมือติดตามปัญหาได้ในเอกสารประกอบสนับสนุนของ Google Maps Platform

โดยระบบจะใช้เคสขอรับความช่วยเหลือหากแยกปัญหาออกจากโปรเจ็กต์หรือส่งผลกระทบต่อลูกค้าบางราย หากไม่มีการประกาศเกี่ยวกับเหตุการณ์แต่คุณยังพบปัญหาอยู่ โปรดไปที่หน้าการสร้างเคสขอรับความช่วยเหลือของ Google Maps Platform (ใน Cloud Console) และสร้างเคสขอรับความช่วยเหลือใหม่

การตรวจสอบ

ทีมวิศวกรผลิตภัณฑ์มีหน้าที่ตรวจสอบสาเหตุที่แท้จริงของเหตุการณ์ต่างๆ ผู้จัดการเหตุการณ์มักจะดําเนินการโดยวิศวกรความน่าเชื่อถือของเว็บไซต์ แต่วิศวกรซอฟต์แวร์หรือผู้อื่นอาจดําเนินการ ทั้งนี้ขึ้นอยู่กับสถานการณ์และผลิตภัณฑ์ ดูข้อมูลเพิ่มเติมได้ที่บทที่ 12 ของหนังสือวิศวกรรมความเสถียรสําหรับเว็บไซต์

การบรรเทาปัญหา/การแก้ไข

ปัญหาจะถือว่าได้รับการแก้ไขแล้วเฉพาะเมื่อมีการเปลี่ยนแปลงที่ Google มั่นใจว่าจะทําให้ผลกระทบสิ้นสุดลงอย่างไม่มีขอบเขต ตัวอย่างเช่น การแก้ไขอาจย้อนกลับการเปลี่ยนแปลงที่ทริกเกอร์เหตุการณ์

ขณะที่เหตุการณ์อยู่ระหว่างการดําเนินการ ทีมสนับสนุนและผลิตภัณฑ์จะพยายามลดปัญหา การบรรเทาปัญหาเกิดขึ้นเมื่อผลกระทบหรือขอบเขตของปัญหาลดลง เช่น ให้ทรัพยากรเพิ่มเติมแก่บริการที่มีการใช้งานมากเกินไปเป็นการชั่วคราว

หากไม่พบการบรรเทาปัญหา ทีมสนับสนุนจะค้นหาและแจ้งวิธีแก้ปัญหาให้ทราบ วิธีแก้ปัญหาคือขั้นตอนที่ทําได้เพื่อแก้ปัญหาความต้องการที่จําเป็นแม้จะมีเหตุการณ์เกิดขึ้น วิธีแก้ปัญหาเบื้องต้นคือ ใช้การตั้งค่าอื่นสําหรับการเรียก API เพื่อหลีกเลี่ยงเส้นทางของโค้ดที่เป็นปัญหา

คำอธิบายเพิ่มเติม

ขณะที่เหตุการณ์เกิดขึ้นอย่างต่อเนื่อง ทีมสนับสนุนจะแจ้งข้อมูลอัปเดตเป็นประจํา โดยทั่วไปแล้ว การอัปเดตจะให้ข้อมูลต่อไปนี้

  • ข้อมูลเพิ่มเติมเกี่ยวกับเหตุการณ์ เช่น ข้อความแสดงข้อผิดพลาด ฟีเจอร์ที่ได้รับผลกระทบ และขอบเขตของเหตุการณ์ดังกล่าว
  • กําลังดําเนินการบรรเทาปัญหา ซึ่งรวมถึงวิธีแก้ปัญหาเฉพาะหน้า
  • ลําดับเวลาของการสื่อสารซึ่งปรับแต่งให้เข้ากับเหตุการณ์
  • การเปลี่ยนแปลงสถานะ เช่น เมื่อมีการแก้ไขเหตุการณ์

การประเมินความเสี่ยง

เหตุการณ์ทั้งหมดส่งผลให้มีการวิเคราะห์ภายในแบบหลัง (หลังเกิดเหตุการณ์) เพื่อทําความเข้าใจเหตุการณ์อย่างสมบูรณ์และระบุการปรับปรุงความน่าเชื่อถือที่ Google ทําได้ จากนั้นระบบจะติดตามและนําการปรับปรุงเหล่านี้ไปใช้ ดูข้อมูลเพิ่มเติมเกี่ยวกับการสรุปข้อมูลที่ Google ได้ที่บทที่ 15 ของหนังสือวิศวกรรมความเสถียรสําหรับเว็บไซต์

รายงานเหตุการณ์

เมื่อเหตุการณ์ส่งผลกระทบอย่างมากและร้ายแรง Google จะแสดงรายงานเหตุการณ์ซึ่งแสดงอาการ ผลกระทบ สาเหตุที่แท้จริง การแก้ไข และการป้องกันเหตุการณ์ในอนาคต เช่นเดียวกับการเขียนรีวิว เช่น เราให้ความสําคัญเป็นพิเศษกับขั้นตอนที่ทําเพื่อเรียนรู้จากปัญหาและปรับปรุงความน่าเชื่อถือ เป้าหมายของ Google ในการเขียนและถอนคําสัญญาคือการโปร่งใสและแสดงถึงความมุ่งมั่นของเราในการสร้างบริการที่มีเสถียรภาพสําหรับลูกค้า

คำถามที่พบบ่อย

ฉันต้องการรับการแจ้งเตือนเมื่อเกิดเหตุไฟฟ้าขัดข้องอย่างต่อเนื่อง ฉันควรทำอย่างไร

  • เข้าร่วมกลุ่มการแจ้งเตือนของ Google Maps Platform เพื่อรับการแจ้งเตือนเกี่ยวกับปัญหาที่ดําเนินอยู่และเพื่อติดตามความคืบหน้าของเหตุการณ์แบบเรียลไทม์ กลุ่มนี้ยังช่วยให้คุณทราบประกาศเกี่ยวกับผลิตภัณฑ์และแพลตฟอร์มอยู่เสมอ
  • ใช้ลิงก์ฟีด RSS หรือประวัติ JSON ที่ด้านล่างของหน้าแดชบอร์ดสถานะสาธารณะของ Maps เพื่อดูฟีดของเหตุการณ์ปัจจุบันและเหตุการณ์ที่ผ่านมา ทุกโพสต์ไปยังแดชบอร์ดจะทริกเกอร์โพสต์ไปยังฟีด แต่ละโพสต์ในฟีดจะประกอบด้วยข้อความและการอัปเดตทั้งหมดที่เกี่ยวข้องกับเหตุการณ์หน้าแดชบอร์ดที่เกี่ยวข้อง เพื่อให้คุณได้รับข้อมูลที่อัปเดตอยู่เสมอ วิธีนี้จะช่วยให้คุณไม่ต้องเจาะลึกข้อมูลประวัติฟีดเพื่อปะติดปะต่อความคืบหน้า ฟีด RSS จะเผยแพร่ในรูปแบบ XML ส่วนขยายของเบราว์เซอร์ เช่น ส่วนขยายการสมัครใช้บริการ RSS (โดย Google) ช่วยให้คุณดูตัวอย่างเนื้อหาฟีดและสมัครรับข้อมูลผ่านโปรแกรมอ่าน RSS ที่ชื่นชอบได้ ประวัติ JSON เป็นเว็บฟีด JSON ของเหตุการณ์ที่ผ่านมา ไลบรารีซอฟต์แวร์และเฟรมเวิร์กเว็บมากมายรองรับการเผยแพร่เนื้อหาผ่านฟีด JSON

ฉันจะดูข้อมูลสถานะประเภทใดในหน้าแรกของแดชบอร์ดได้

หน้าแดชบอร์ดสถานะสาธารณะของ Google Maps ให้ข้อมูลเกี่ยวกับ API และบริการที่ เป็นส่วนหนึ่งของ Google Maps Platform หากเกิดเหตุการณ์ที่ทํางานอยู่ ระบบจะโพสต์ข้อมูลไว้ที่นี่สําหรับ API และบริการแต่ละอย่างภายใน Google Maps Platform ตัวบ่งชี้สถานะจะแสดงเสมอเพื่อแสดงประสิทธิภาพโดยรวมสําหรับ API และบริการแต่ละรายการ ดังต่อไปนี้

  • บริการหยุดทํางาน: ระบบที่ใช้งานจริงหรือบริการใช้งานไม่ได้ วิธีแก้ปัญหาเบื้องต้นได้แก่ ไม่พร้อมใช้งานหรือติดตั้งใช้งานได้ยาก
  • บริการขัดข้อง: ระบบที่ใช้งานจริงหรือบริการมีความบกพร่องบางส่วนและ/หรือไม่ทํางานตามที่คาดหวัง วิธีแก้ปัญหามีอยู่จริง
  • ข้อมูลบริการ: ระบบที่ใช้งานจริงหรือบริการมีความบกพร่องบางส่วนและ/หรือไม่ทํางานตามที่คาดหวัง โดยทั่วไปแล้ว บริการจะยังคงใช้งานได้ แต่ผลกระทบจะมีเพียงเล็กน้อยและส่งผลต่อผู้ใช้กลุ่มเล็กๆ
  • พร้อมใช้งาน: บริการทํางานได้อย่างสมบูรณ์และทํางานตามที่คาดไว้

หน้าแดชบอร์ดเป็นแบบเรียลไทม์หรือไม่

หน้าแดชบอร์ดสถานะสาธารณะของ Maps มีไว้เพื่อแสดงสถานะที่ใกล้เคียงเกือบของผลิตภัณฑ์ที่พร้อมใช้งานโดยทั่วไปและเป็นไปตาม SLA ของ Google Maps Platform เหตุการณ์ทั้งหมดจะได้รับการยืนยันก่อนการโพสต์ ดังนั้นอาจมีความล่าช้าเล็กน้อยนับจากเวลาที่ตรวจพบเหตุการณ์นั้นครั้งแรก ดังนั้น แดชบอร์ดจึงไม่ควรใช้เพื่อจุดประสงค์ในการติดตามระยะเวลาทํางาน

ฉันจะใช้แดชบอร์ดเพื่อตรวจสอบระยะเวลาทํางานของ Google Maps Platform ได้ไหม

หน้าแดชบอร์ดสถานะสาธารณะของ Maps ไม่ได้มีไว้เพื่อติดตามสถานะของบริการ GMP ตาม SLA ของ GMP เนื่องจากระยะเวลาการหยุดทํางานที่แสดงในหน้าแดชบอร์ดอาจไม่ตรงกับข้อมูล "ช่วงพัก" (ตามที่กําหนดไว้ใน SLA) สําหรับโปรเจ็กต์ โดยเฉพาะเมื่อเกิดเหตุการณ์ที่ความรุนแรงต่ํากว่า นอกจากนี้ระยะเวลาที่แสดงอาจขยายเวลาหลังจากที่ปัญหาลดลงด้วย เพื่อเป็นการยืนยันการแก้ไขอย่างสมบูรณ์

หากต้องการตรวจสอบการใช้งาน API ให้สร้างแดชบอร์ด และสร้างการแจ้งเตือน ให้ไปที่ Google Maps Platform Monitoring

จะเกิดอะไรขึ้นหากไม่เห็นเหตุการณ์ในหน้าแดชบอร์ด

ทั้งนี้ ลูกค้าและโปรเจ็กต์ทั้งหมดจะไม่ได้รับผลกระทบจากเหตุการณ์ทั้งหมด หน้าแดชบอร์ดจะแสดงเฉพาะเหตุการณ์ที่รุนแรงและร้ายแรงเท่านั้น หากพบปัญหาที่ไม่ปรากฏในแดชบอร์ด โปรดติดต่อทีมสนับสนุน

ฉันจะดูข้อมูลเกี่ยวกับบริการข้อขัดข้องและความขัดข้องที่ผ่านมาได้จากที่ใด

หน้าประวัติในแดชบอร์ดสถานะสาธารณะของ Maps คือที่เก็บเหตุขัดข้องและการหยุดทํางานในช่วง 365 วันที่ผ่านมา คลิกเหตุการณ์เพื่อตรวจสอบโพสต์เกี่ยวกับเหตุการณ์ขณะที่เหตุการณ์กําลังดําเนินอยู่ รวมถึงรายงานเหตุการณ์ที่เผยแพร่โดยทีมสนับสนุน

ใครอัปเดตแดชบอร์ดบ้าง

ทีมสนับสนุน Google Maps Platform ทั่วโลกจะคอยตรวจสอบสถานะของบริการโดยใช้สัญญาณประเภทต่างๆ และอัปเดตหน้าแดชบอร์ดในกรณีที่เกิดปัญหาในวงกว้าง หากจําเป็น บุคคลดังกล่าวจะโพสต์รายงานการวิเคราะห์โดยละเอียดหลังจากแก้ปัญหาแล้วด้วย

"เหตุการณ์" กับ "การหยุดทํางาน" แตกต่างกันอย่างไร

ถึงแม้ว่าคําเหล่านี้มักจะใช้แทนกันได้ แต่แดชบอร์ดสถานะสาธารณะของ Maps และการสื่อสารภายนอกของเราใช้ "เหตุการณ์" เพื่ออ้างถึงช่วงเวลาใดๆ ของบริการที่ลดหย่อนและ "การหยุดทํางาน" เพื่ออ้างถึงความบกพร่องที่ร้ายแรงที่สุดเท่านั้น ที่บริการจะทํางานไม่ได้ตามขอบเขตที่มีการให้บริการลูกค้าของเราโดยไร้ประสิทธิภาพ