این راهنما اطلاعات مهمی را در مورد دادههایی که در گزارشهای تولید شده با استفاده از API داده گوگل آنالیتیکس مشاهده میکنید، توضیح میدهد. کاربران اغلب با اختلاف بین دادههای برگردانده شده توسط API (به طور خاص متد runReport ) و دادههای نشان داده شده در رابط کاربری گوگل آنالیتیکس مواجه میشوند.
نمونهگیری و تجمیع
متد runReport رابط برنامهنویسی کاربردی داده گوگل آنالیتیکس میتواند دادههای نمونهبرداری شده را برگرداند، به خصوص برای مجموعه دادههای بزرگ یا پرسوجوهای پیچیده. در حالی که رابط کاربری گوگل آنالیتیکس نیز نمونهبرداری را اعمال میکند، آستانهها و الگوریتمهای خاص میتوانند متفاوت باشند و منجر به تفاوتهای جزئی در مقادیر گزارش شده شوند.
برای درک اینکه آیا نتایج گزارش بر اساس زیرمجموعهای از دادههای موجود است، فیلد samplingMetadatas از شیء ResponseMetaData را بررسی کنید. اگر نتایج گزارش نمونهبرداری شده باشند، این فیلد درصد رویدادهای استفاده شده در این گزارش را شرح میدهد.
برخی از روشهای گزارشدهی API داده گوگل آنالیتیکس به شما امکان میدهند سطح نمونهبرداری مورد نظر خود را مشخص کنید. میتوانید از فیلد samplingLevel از متد properties.reportTasks.create برای کنترل سطح نمونهبرداری گزارش استفاده کنید.
این ویژگی به ویژگیهای Google Analytics 360 امکان دسترسی به محدودیتهای نمونهبرداری بالاتر از ۱ میلیارد رویداد را میدهد. همچنین، میتوان محدودیتهای نمونهبرداری را روی UNSAMPLED تنظیم کرد تا از نتایج نمونهبرداری نشده برای تعداد رویدادهای بزرگ استفاده شود.
برای اطلاعات بیشتر، به «درباره نمونهگیری دادهها» مراجعه کنید.
تقریب شمارش منحصر به فرد
رابط برنامهنویسی کاربردی داده گوگل آنالیتیکس (Google Analytics Data API) از الگوریتم HyperLogLog++ (HLL++) برای تخمین تعداد منحصر به فرد برای معیارهایی مانند کاربران فعال و جلسات استفاده میکند. این رویکرد در API و رابط کاربری گوگل آنالیتیکس برای بهبود عملکرد و مدیریت کارآمد مجموعه دادههای بزرگ استفاده میشود، به این معنی که نتایج به جای تعداد دقیق، تقریبی هستند.
برای اطلاعات بیشتر، به منابع زیر مراجعه کنید: تقریب تعداد منحصر به فرد در گوگل آنالیتیکس و تفاوتها در تعداد کاربران .
آستانهگذاری دادهها
گوگل آنالیتیکس ممکن است آستانهگذاری دادهها را برای گزارشها اعمال کند تا از شناسایی کاربران بر اساس اطلاعات جمعیتشناختی، علایق یا سایر سیگنالهای موجود در دادهها جلوگیری کند.
اگر یک ردیف گزارش شامل تعداد کمی کاربر باشد، ممکن است آن ردیف از نتایج حذف شود. این امر در گزارشهایی که شامل ابعاد با کاردینالیتی بالا یا ابعاد سفارشی هستند، رایجتر است.
برای فهمیدن اینکه آیا این گزارش مشمول آستانهگذاری است یا خیر، فیلد subjectToThresholding از شیء ResponseMetaData را بررسی کنید.
برای اطلاعات بیشتر، به آستانههای داده مراجعه کنید.
ردیف (other)
اگر یک بُعد، کاردینالیتی بالایی داشته باشد، گوگل آنالیتیکس ممکن است مقادیر کمتر رایج را در ردیفی با برچسب (other) گروهبندی کند. این امر در گزارشهایی که شامل بُعدهایی با بیش از ۵۰۰ مقدار منحصر به فرد در روز هستند، رایجتر است.
هنگام استفاده از فیلترها با Data API، توجه داشته باشید که فیلترها درون ردیف (other) جستجو نمیکنند و پس از تجمیع دادهها و ایجاد ردیف (other) اعمال میشوند.
برای فهمیدن اینکه آیا یک گزارش حاوی دادههایی است که در ردیف (other) قرار گرفتهاند یا خیر، فیلد dataLossFromOtherRow از شیء ResponseMetaData را بررسی کنید.
برای اطلاعات بیشتر، به ردیف (سایر) در گوگل آنالیتیکس ۴ مراجعه کنید.
گزارش هویت
هویت گزارشدهنده نحوهی حذف اطلاعات تکراری کاربران در گزارشها را تعیین میکند. تنظیمات هویت متفاوت (مانند «ترکیبی» یا «مبتنی بر دستگاه») میتواند منجر به تعداد کاربران متفاوت برای یک محدودهی زمانی یکسان شود.
رابط کاربری گوگل آنالیتیکس و رابط برنامهنویسی داده (Data API) هر دو از تنظیمات هویت گزارشدهی یکسانی برای دارایی شما استفاده میکنند. اگر این تنظیم تغییر کند، بر گزارشها در رابط کاربری و رابط برنامهنویسی تأثیر میگذارد. اگر این تنظیم بین اجرای یک گزارش در رابط کاربری و دریافت دادههای گزارش از طریق API تغییر کند، ممکن است تعداد کاربران بین دو گزارش برای یک محدوده تاریخی یکسان متفاوت باشد.
ویژگی پرس و جو
برای به حداقل رساندن اختلافات، اطمینان حاصل کنید که پارامترهای زیر در درخواست API شما دقیقاً با تنظیمات گزارش رابط کاربری گوگل آنالیتیکس مطابقت دارند:
- محدودههای تاریخ : تأیید کنید که تاریخ شروع و پایان یکسان باشند.
- ابعاد و معیارها : اطمینان حاصل کنید که ابعاد و معیارهای موجود در درخواست API شما با ابعاد و معیارهای موجود در گزارش رابط کاربری گوگل آنالیتیکس یکسان باشند.
- فیلترها : مطمئن شوید که هر فیلتر ابعادی یا متریکی که در درخواست API اعمال میشود، با فیلترهای استفاده شده در رابط کاربری مطابقت دارد.
افزودن ابعاد به یک گزارش میتواند منجر به کاهش رویدادهای مورد استفاده در محاسبات شود. فقط رویدادهایی که حاوی دادههایی برای ابعاد درخواستی هستند در گزارش گنجانده میشوند. در نتیجه، افزودن ابعاد به یک پرسوجو میتواند مقادیر تجمیعشده برای معیارها در یک گزارش را تغییر دهد.
تازگی دادهها
گوگل آنالیتیکس برای پردازش و جمعآوری دادههای رویداد زمان میبرد. هنگام کار با دادههای بسیار جدید، اگر بین بازیابی دادهها تأخیر زمانی وجود داشته باشد، ممکن است تفاوتهای جزئی بین گزارشها مشاهده کنید. به عنوان مثال، اگر گزارشی را در رابط کاربری مشاهده کنید و سپس دقایقی بعد از API برای همان گزارش پرس و جو کنید، ممکن است دادهها به دلیل پردازش و جمعآوری مداوم تغییر کرده باشند.
برای اطلاعات بیشتر، به تازگی دادهها مراجعه کنید.
جایگزینهای دادههای نمونهبرداری نشده
اگر مورد استفاده شما به دادههای کامل و نمونهبرداری نشده در سطح رویداد نیاز دارد، استفاده از گزینههای زیر را در نظر بگیرید:
خروجی BigQuery : خروجی BigQuery برای گوگل آنالیتیکس
روش پیشنهادی برای تجزیه و تحلیل پیشرفته دادههای خام رویداد است.
آنالیتیکس ۳۶۰ : املاک دارای مجوز آنالیتیکس ۳۶۰ محدودیتهای نمونهگیری بالاتری دارند و به ویژگیهای گزارشدهی دقیقتری دسترسی دارند.