Monitoring

การเพิ่มประสิทธิภาพการทำงานเริ่มต้นด้วยการระบุเมตริกหลัก ซึ่งมักเกี่ยวข้องกับเวลาในการตอบสนองและอัตราการส่งข้อมูล การเพิ่มการตรวจสอบเพื่อบันทึกและติดตามเมตริกเหล่านี้จะแสดงจุดอ่อนในแอปพลิเคชัน เมตริกช่วยให้คุณดำเนินการ เพิ่มประสิทธิภาพเพื่อปรับปรุงเมตริกประสิทธิภาพได้

นอกจากนี้ ยังมีเครื่องมือการตรวจสอบมากมายที่ให้คุณตั้งค่าการแจ้งเตือนสำหรับเมตริกเพื่อรับการแจ้งเตือนเมื่อถึงเกณฑ์ที่กำหนด เช่น คุณอาจตั้งค่าการแจ้งเตือนให้แจ้งเตือนเมื่อเปอร์เซ็นต์ของคำขอที่ล้มเหลวเพิ่มขึ้นมากกว่า x% ของระดับปกติ เครื่องมือตรวจสอบสามารถช่วยให้คุณระบุได้ว่าประสิทธิภาพการทำงานปกติเป็นอย่างไร และระบุเวลาในการตอบสนองที่เพิ่มขึ้นอย่างผิดปกติ จำนวนข้อผิดพลาด และเมตริกหลักอื่นๆ ความสามารถในการตรวจสอบเมตริกเหล่านี้มีความสำคัญอย่างยิ่งในช่วงกรอบเวลาที่มีความสำคัญต่อธุรกิจ หรือหลังจากที่มีพุชโค้ดใหม่เป็นเวอร์ชันที่ใช้งานจริง

ระบุเมตริกเวลาในการตอบสนอง

ตรวจสอบว่า UI ของคุณตอบสนองได้ดีเท่าที่ทำได้ โดยสังเกตว่าผู้ใช้คาดหวังมาตรฐานที่สูงยิ่งขึ้นจากแอปบนอุปกรณ์เคลื่อนที่ นอกจากนี้ คุณยังควรวัดและติดตามเวลาในการตอบสนองสำหรับบริการแบ็กเอนด์ด้วย โดยเฉพาะอย่างยิ่ง เนื่องจากอาจนำไปสู่ปัญหาอัตราการส่งข้อมูลหากไม่เลือก

เมตริกที่แนะนําที่ควรติดตามมีดังต่อไปนี้

  • ระยะเวลาของคำขอ
  • ระยะเวลาของคำขอในรายละเอียดของระบบย่อย (เช่น การเรียก API)
  • ระยะเวลาในการทำงาน

ระบุเมตริกอัตราการส่งข้อมูล

อัตราการส่งข้อมูลคือการวัดจำนวนคำขอทั้งหมดที่แสดงในช่วงระยะเวลาหนึ่งๆ อัตราการส่งข้อมูลอาจได้รับผลกระทบจากเวลาในการตอบสนองของระบบย่อย คุณจึงอาจต้องเพิ่มประสิทธิภาพเพื่อเวลาในการตอบสนองเพื่อปรับปรุงอัตราการส่งข้อมูล

เมตริกที่ควรติดตามมีดังนี้

  • จำนวนคำค้นหาต่อวินาที
  • ขนาดของข้อมูลที่โอนต่อวินาที
  • จำนวนการดำเนินการ I/O ต่อวินาที
  • การใช้งานทรัพยากร เช่น การใช้ CPU หรือหน่วยความจำ
  • ขนาดของการประมวลผลข้อมูลค้าง เช่น pub/sub หรือจำนวนชุดข้อความ

ไม่ใช่แค่ค่าเฉลี่ย

ข้อผิดพลาดที่พบบ่อยในการวัดประสิทธิภาพจะดูจากค่าเฉลี่ย (ค่าเฉลี่ย) เท่านั้น แม้ว่าวิธีนี้จะเป็นประโยชน์ แต่ก็ไม่ได้ให้ข้อมูลเชิงลึกเกี่ยวกับการกระจายของเวลาในการตอบสนอง เมตริกที่ดีกว่าในการติดตามคือเปอร์เซ็นต์ไทล์ประสิทธิภาพ เช่น เปอร์เซ็นไทล์ที่ 50/75/90/99 สำหรับเมตริกหนึ่งๆ

โดยทั่วไปแล้ว การเพิ่มประสิทธิภาพสามารถทำได้ใน 2 ขั้นตอน อย่างแรก ให้เพิ่มประสิทธิภาพสำหรับ เวลาในการตอบสนองของเปอร์เซ็นไทล์ที่ 90 จากนั้นพิจารณาเปอร์เซ็นไทล์ที่ 99 หรือที่เรียกอีกอย่างว่าเวลาในการตอบสนองช่วงปลาย ซึ่งเป็นคำขอส่วนน้อยที่ใช้เวลาดำเนินการนานกว่ามาก

การตรวจสอบฝั่งเซิร์ฟเวอร์สำหรับผลลัพธ์โดยละเอียด

โดยทั่วไปแล้ว เราแนะนำให้ใช้การทำโปรไฟล์ฝั่งเซิร์ฟเวอร์สำหรับเมตริกการติดตาม ฝั่งเซิร์ฟเวอร์มักจะใช้เครื่องมือได้ง่ายกว่า ทำให้เข้าถึงข้อมูลได้ละเอียดยิ่งขึ้น และไม่ได้รับผลกระทบจากปัญหาการเชื่อมต่อใดๆ

การตรวจสอบเบราว์เซอร์สำหรับการมองเห็นจากต้นทางถึงปลายทาง

การทำโปรไฟล์เบราว์เซอร์จะให้ข้อมูลเชิงลึกเพิ่มเติมเกี่ยวกับประสบการณ์ของผู้ใช้ปลายทางได้ โดยจะแสดงให้เห็นว่าหน้าใดมีคำขอที่ช้า ซึ่งคุณนำไปเชื่อมโยงกับการตรวจสอบฝั่งเซิร์ฟเวอร์เพื่อวิเคราะห์เพิ่มเติมได้

Google Analytics มีเครื่องมือตรวจสอบเวลาที่ใช้ในการโหลดหน้าเว็บได้ทันทีในรายงานการจับเวลาหน้าเว็บ บทความนี้นำเสนอมุมมองที่เป็นประโยชน์หลายด้านต่อการทำความเข้าใจประสบการณ์ของผู้ใช้ในเว็บไซต์ โดยเฉพาะในเรื่องต่อไปนี้

  • เวลาในการโหลดหน้าเว็บ
  • เปลี่ยนเส้นทางเวลาที่ใช้ในการโหลด
  • เวลาในการตอบกลับของเซิร์ฟเวอร์

การตรวจสอบในระบบคลาวด์

มีเครื่องมือหลายอย่างที่คุณสามารถใช้บันทึกและตรวจสอบเมตริกประสิทธิภาพของแอปพลิเคชัน ตัวอย่างเช่น คุณอาจใช้ Google Cloud Logging เพื่อบันทึกเมตริกประสิทธิภาพไปยังโปรเจ็กต์ Google Cloud จากนั้นตั้งค่าหน้าแดชบอร์ดใน Google Cloud Monitoring เพื่อตรวจสอบและแบ่งกลุ่มเมตริกที่บันทึกไว้

อ่านคู่มือการบันทึกเพื่อดูตัวอย่างของการบันทึกไปยัง Google Cloud Logging จากตัวตรวจจับที่กำหนดเองในไลบรารีไคลเอ็นต์ Python เมื่อมีข้อมูลดังกล่าวใน Google Cloud คุณจะสร้างเมตริกเพิ่มเติมจากข้อมูลที่บันทึก เพื่อให้มองเห็นแอปพลิเคชันผ่าน Google Cloud Monitoring ได้ ทำตามคำแนะนำสำหรับเมตริกตามบันทึกที่ผู้ใช้กำหนดเพื่อสร้างเมตริกโดยใช้บันทึกที่ส่งไปยัง Google Cloud Logging

อีกทางเลือกหนึ่งคือ คุณสามารถใช้ไลบรารีของไคลเอ็นต์ Monitoring เพื่อกำหนดเมตริกในโค้ด และส่งเมตริกเหล่านั้นไปยัง Monitoring โดยตรงแยกต่างหากจากบันทึก

ตัวอย่างเมตริกตามบันทึก

สมมติว่าคุณต้องการตรวจสอบค่า is_fault เพื่อทำความเข้าใจอัตราข้อผิดพลาดในแอปพลิเคชันของคุณให้ดียิ่งขึ้น คุณแยกค่า is_fault จากบันทึกไปไว้ในเมตริกตัวนับใหม่ได้ ErrorCount

การกำหนดค่าเมตริก

ตัวกรองและป้ายกำกับในเมตริก

ใน Cloud Logging ป้ายกำกับจะช่วยให้คุณจัดกลุ่มเมตริกเป็นหมวดหมู่ต่างๆ โดยอิงตามข้อมูลอื่นๆ ในบันทึก คุณกำหนดค่าป้ายกำกับสำหรับช่อง method ที่ส่งไปยัง Cloud Logging ได้เพื่อดูการแจกแจงจำนวนข้อผิดพลาดตามเมธอดของ Google Ads API

เมื่อกำหนดค่าเมตริก ErrorCount และป้ายกำกับ Method แล้ว คุณจะสร้างแผนภูมิใหม่ในแดชบอร์ด Monitoring เพื่อตรวจสอบ ErrorCount ซึ่งจัดกลุ่มตาม Method ได้

หน้าแดชบอร์ด ErrorCount

การแจ้งเตือน

คุณกำหนดค่านโยบายการแจ้งเตือนได้ใน Cloud Monitoring และในเครื่องมืออื่นๆ ซึ่งจะระบุเวลาและวิธีที่เมตริกทริกเกอร์การแจ้งเตือน สำหรับคำแนะนำในการตั้งค่าการแจ้งเตือน Cloud Monitoring โปรดทำตามคู่มือการแจ้งเตือน