คู่มือนี้อธิบายข้อมูลสําคัญเกี่ยวกับข้อมูลที่คุณเห็นในรายงานที่สร้างขึ้นโดยใช้ Google Analytics Data API ผู้ใช้มักพบความคลาดเคลื่อนระหว่างข้อมูลที่ API ส่งคืน (โดยเฉพาะเมธอด runReport) กับข้อมูลที่แสดงใน UI ของ Google Analytics
การสุ่มตัวอย่างและการรวมข้อมูล
เมธอด runReport ของ Google Analytics Data API สามารถส่งคืนข้อมูลจากการสุ่มตัวอย่าง โดยเฉพาะอย่างยิ่งสําหรับชุดข้อมูลขนาดใหญ่หรือการค้นหาที่ซับซ้อน แม้ว่า UI ของ Google Analytics จะใช้การสุ่มตัวอย่างด้วย แต่เกณฑ์และอัลกอริทึมที่เฉพาะเจาะจงอาจแตกต่างกัน ซึ่งส่งผลให้ค่าที่รายงานมีความแตกต่างกันเล็กน้อย
หากต้องการทราบว่าผลลัพธ์ของรายงานอิงตามชุดย่อยของ
ข้อมูลที่มีอยู่หรือไม่ ให้ตรวจสอบ
samplingMetadatas
ฟิลด์ของออบเจ็กต์ ResponseMetaData หากผลลัพธ์ของรายงานถูกสุ่มตัวอย่าง ฟิลด์นี้จะอธิบายเปอร์เซ็นต์ของเหตุการณ์ที่ใช้ในรายงานนี้
วิธีการรายงานบางอย่างของ Google Analytics Data API ช่วยให้คุณระบุระดับการสุ่มตัวอย่างที่ต้องการได้ คุณสามารถใช้
samplingLevel
ฟิลด์ของเมธอด properties.reportTasks.create
เพื่อควบคุมระดับการสุ่มตัวอย่างของรายงานได้
ฟีเจอร์นี้ช่วยให้พร็อพเพอร์ตี้ Google Analytics 360 เข้าถึงขีดจํากัดการสุ่มตัวอย่างที่สูงขึ้นถึง 1,000 ล้านเหตุการณ์ นอกจากนี้ คุณยังตั้งค่าขีดจํากัดการสุ่มตัวอย่างเป็น UNSAMPLED เพื่อใช้ผลลัพธ์แบบไม่สุ่มตัวอย่างสําหรับจํานวนเหตุการณ์ขนาดใหญ่ได้ด้วย
ดูข้อมูลเพิ่มเติมได้ที่หัวข้อเกี่ยวกับการสุ่มตัวอย่างข้อมูล
การประมาณจํานวนที่ไม่ซ้ำกัน
Google Analytics Data API ใช้อัลกอริทึม HyperLogLog++ (HLL++) เพื่อประมาณจํานวนที่ไม่ซ้ำกันสําหรับเมตริก เช่น ผู้ใช้ที่ใช้งานอยู่และเซสชัน เราใช้วิธีนี้ใน API และ UI ของ Google Analytics เพื่อปรับปรุงประสิทธิภาพและจัดการชุดข้อมูลขนาดใหญ่อย่างมีประสิทธิภาพ ซึ่งหมายความว่าผลลัพธ์จะเป็นค่าประมาณแทนที่จะเป็นจํานวนที่แน่นอน
ดูบริบทเพิ่มเติมได้ที่แหล่งข้อมูลต่อไปนี้: การประมาณจํานวนที่ไม่ซ้ำกันใน Google Analytics และ ความแตกต่างของจํานวนผู้ใช้
การใช้เกณฑ์ข้อมูล
Google Analytics อาจใช้เกณฑ์ข้อมูลกับรายงานเพื่อป้องกันการระบุตัวตนของผู้ใช้แต่ละรายตามข้อมูลประชากร ความสนใจ หรือสัญญาณอื่นๆ ที่แสดงในข้อมูล
หากแถวของรายงานมีผู้ใช้จํานวนน้อย ระบบอาจยกเว้นแถวดังกล่าวจากผลลัพธ์ ซึ่งมักเกิดขึ้นในรายงานที่มีมิติข้อมูล High Cardinality หรือมิติข้อมูลที่กําหนดเอง
หากต้องการทราบว่ารายงานนี้อยู่ภายใต้การใช้เกณฑ์หรือไม่ ให้ตรวจสอบ
subjectToThresholding
ฟิลด์ของออบเจ็กต์ ResponseMetaData
ดูข้อมูลเพิ่มเติมได้ที่หัวข้อเกณฑ์ของข้อมูล
แถว (other)
หากมิติข้อมูลมีคาร์ดินัลลิตี้สูง Google Analytics อาจจัดกลุ่มค่าที่พบได้ไม่บ่อยนัก ไว้ในแถวที่มีป้ายกํากับว่า (other) ซึ่งมักเกิดขึ้นในรายงานที่มีมิติข้อมูลที่มีค่าที่ไม่ซ้ำกันมากกว่า 500 ค่าต่อวัน
เมื่อใช้ตัวกรองกับ Data API โปรดทราบว่าตัวกรองจะไม่ดูภายใน แถว (other) และจะใช้ หลังจาก ที่ระบบรวมข้อมูลและ สร้างแถว (other) แล้ว
หากต้องการทราบว่ารายงานมีข้อมูลที่รวมอยู่ในแถว (other) หรือไม่
ให้ตรวจสอบ
dataLossFromOtherRow
ฟิลด์ของออบเจ็กต์ ResponseMetaData
ดูข้อมูลเพิ่มเติมได้ที่หัวข้อแถว (อื่นๆ) ใน Google Analytics 4
ข้อมูลระบุตัวตนในการรายงาน
ข้อมูลระบุตัวตนในการรายงาน จะกำหนดวิธีลบข้อมูลที่ซ้ำกันของผู้ใช้ออกจากรายงาน การตั้งค่าข้อมูลระบุตัวตนที่แตกต่างกัน (เช่น "ผสม" หรือ "อิงตามอุปกรณ์") อาจส่งผลให้จํานวนผู้ใช้แตกต่างกันสําหรับช่วงวันที่เดียวกัน
ทั้ง UI ของ Google Analytics และ Data API ใช้การตั้งค่าข้อมูลระบุตัวตนในการรายงานเดียวกันสําหรับพร็อพเพอร์ตี้ หากมีการเปลี่ยนแปลงการตั้งค่านี้ ระบบจะส่งผลต่อรายงานทั้งใน UI และ API หากมีการเปลี่ยนแปลงการตั้งค่าระหว่างการเรียกใช้รายงานใน UI กับการรับข้อมูลรายงานผ่าน API จํานวนผู้ใช้อาจแตกต่างกันระหว่างรายงาน 2 ฉบับสําหรับช่วงวันที่เดียวกัน
ความเฉพาะเจาะจงของการค้นหา
ตรวจสอบว่าพารามิเตอร์ต่อไปนี้ในคําขอ API ตรงกับการตั้งค่าในรายงาน UI ของ Google Analytics อย่างแม่นยํา เพื่อลดความคลาดเคลื่อนให้เหลือน้อยที่สุด
- ช่วงวันที่: ตรวจสอบว่าวันที่เริ่มต้นและวันที่สิ้นสุดเหมือนกัน
- มิติข้อมูลและเมตริก: ตรวจสอบว่ามิติข้อมูลและเมตริกในคําขอ API เหมือนกับมิติข้อมูลและเมตริกในรายงาน UI ของ Google Analytics
- ตัวกรอง: ตรวจสอบว่าตัวกรองมิติข้อมูลหรือเมตริกที่ใช้ใน คําขอ API ตรงกับตัวกรองที่ใช้ใน UI
การเพิ่มมิติข้อมูลลงในรายงานอาจส่งผลให้มีการใช้เหตุการณ์ในการคํานวณน้อยลง ระบบจะรวมเฉพาะเหตุการณ์ที่มีข้อมูลสําหรับมิติข้อมูลที่ขอไว้ในรายงาน ด้วยเหตุนี้ การเพิ่มมิติข้อมูลลงในการค้นหาจึงอาจเปลี่ยนค่าที่รวมสําหรับเมตริกในรายงานได้
ความใหม่ของข้อมูล
Google Analytics ต้องใช้เวลาในการประมวลผลและรวมข้อมูลเหตุการณ์ เมื่อใช้ข้อมูลล่าสุด คุณอาจเห็นความแตกต่างเล็กน้อยระหว่างรายงานหากมีการหน่วงเวลาในการดึงข้อมูล ตัวอย่างเช่น หากคุณดูรายงานใน UI แล้วค้นหา API สําหรับรายงานเดียวกันในอีกไม่กี่นาทีต่อมา ข้อมูลอาจมีการเปลี่ยนแปลงเนื่องจากการประมวลผลและการรวมข้อมูลที่ดําเนินอยู่
ดูข้อมูลเพิ่มเติมได้ที่ หัวข้อความใหม่ของข้อมูล
ตัวเลือกข้อมูลแบบไม่สุ่มตัวอย่าง
หากกรณีการใช้งานของคุณต้องใช้ข้อมูลระดับเหตุการณ์แบบเต็มและไม่สุ่มตัวอย่าง ให้ลองใช้ตัวเลือกต่อไปนี้
BigQuery Export: BigQuery Export สําหรับ Google Analytics
เป็นวิธีที่แนะนําสําหรับการวิเคราะห์ข้อมูลเหตุการณ์ดิบขั้นสูง
Analytics 360: พร็อพเพอร์ตี้ที่มีใบอนุญาต Analytics 360 มีขีดจํากัดการสุ่มตัวอย่างที่สูงขึ้น และเข้าถึงฟีเจอร์การรายงานที่มีรายละเอียดมากขึ้น