گزارش انتظارات داده

این راهنما اطلاعات مهمی را در مورد داده‌هایی که در گزارش‌های تولید شده با استفاده از API داده گوگل آنالیتیکس مشاهده می‌کنید، توضیح می‌دهد. کاربران اغلب با اختلاف بین داده‌های برگردانده شده توسط API (به طور خاص متد runReport ) و داده‌های نشان داده شده در رابط کاربری گوگل آنالیتیکس مواجه می‌شوند.

نمونه‌گیری و تجمیع

متد runReport رابط برنامه‌نویسی کاربردی داده گوگل آنالیتیکس می‌تواند داده‌های نمونه‌برداری شده را برگرداند، به خصوص برای مجموعه داده‌های بزرگ یا پرس‌وجوهای پیچیده. در حالی که رابط کاربری گوگل آنالیتیکس نیز نمونه‌برداری را اعمال می‌کند، آستانه‌ها و الگوریتم‌های خاص می‌توانند متفاوت باشند و منجر به تفاوت‌های جزئی در مقادیر گزارش شده شوند.

برای درک اینکه آیا نتایج گزارش بر اساس زیرمجموعه‌ای از داده‌های موجود است، فیلد samplingMetadatas از شیء ResponseMetaData را بررسی کنید. اگر نتایج گزارش نمونه‌برداری شده باشند، این فیلد درصد رویدادهای استفاده شده در این گزارش را شرح می‌دهد.

برخی از روش‌های گزارش‌دهی API داده گوگل آنالیتیکس به شما امکان می‌دهند سطح نمونه‌برداری مورد نظر خود را مشخص کنید. می‌توانید از فیلد samplingLevel از متد properties.reportTasks.create برای کنترل سطح نمونه‌برداری گزارش استفاده کنید.

این ویژگی به ویژگی‌های Google Analytics 360 امکان دسترسی به محدودیت‌های نمونه‌برداری بالاتر از ۱ میلیارد رویداد را می‌دهد. همچنین، می‌توان محدودیت‌های نمونه‌برداری را روی UNSAMPLED تنظیم کرد تا از نتایج نمونه‌برداری نشده برای تعداد رویدادهای بزرگ استفاده شود.

برای اطلاعات بیشتر، به «درباره نمونه‌گیری داده‌ها» مراجعه کنید.

تقریب شمارش منحصر به فرد

رابط برنامه‌نویسی کاربردی داده گوگل آنالیتیکس (Google Analytics Data API) از الگوریتم HyperLogLog++ (HLL++) برای تخمین تعداد منحصر به فرد برای معیارهایی مانند کاربران فعال و جلسات استفاده می‌کند. این رویکرد در API و رابط کاربری گوگل آنالیتیکس برای بهبود عملکرد و مدیریت کارآمد مجموعه داده‌های بزرگ استفاده می‌شود، به این معنی که نتایج به جای تعداد دقیق، تقریبی هستند.

برای اطلاعات بیشتر، به منابع زیر مراجعه کنید: تقریب تعداد منحصر به فرد در گوگل آنالیتیکس و تفاوت‌ها در تعداد کاربران .

آستانه‌گذاری داده‌ها

گوگل آنالیتیکس ممکن است آستانه‌گذاری داده‌ها را برای گزارش‌ها اعمال کند تا از شناسایی کاربران بر اساس اطلاعات جمعیت‌شناختی، علایق یا سایر سیگنال‌های موجود در داده‌ها جلوگیری کند.

اگر یک ردیف گزارش شامل تعداد کمی کاربر باشد، ممکن است آن ردیف از نتایج حذف شود. این امر در گزارش‌هایی که شامل ابعاد با کاردینالیتی بالا یا ابعاد سفارشی هستند، رایج‌تر است.

برای فهمیدن اینکه آیا این گزارش مشمول آستانه‌گذاری است یا خیر، فیلد subjectToThresholding از شیء ResponseMetaData را بررسی کنید.

برای اطلاعات بیشتر، به آستانه‌های داده مراجعه کنید.

ردیف (other)

اگر یک بُعد، کاردینالیتی بالایی داشته باشد، گوگل آنالیتیکس ممکن است مقادیر کمتر رایج را در ردیفی با برچسب (other) گروه‌بندی کند. این امر در گزارش‌هایی که شامل بُعدهایی با بیش از ۵۰۰ مقدار منحصر به فرد در روز هستند، رایج‌تر است.

هنگام استفاده از فیلترها با Data API، توجه داشته باشید که فیلترها درون ردیف (other) جستجو نمی‌کنند و پس از تجمیع داده‌ها و ایجاد ردیف (other) اعمال می‌شوند.

برای فهمیدن اینکه آیا یک گزارش حاوی داده‌هایی است که در ردیف (other) قرار گرفته‌اند یا خیر، فیلد dataLossFromOtherRow از شیء ResponseMetaData را بررسی کنید.

برای اطلاعات بیشتر، به ردیف (سایر) در گوگل آنالیتیکس ۴ مراجعه کنید.

گزارش هویت

هویت گزارش‌دهنده نحوه‌ی حذف اطلاعات تکراری کاربران در گزارش‌ها را تعیین می‌کند. تنظیمات هویت متفاوت (مانند «ترکیبی» یا «مبتنی بر دستگاه») می‌تواند منجر به تعداد کاربران متفاوت برای یک محدوده‌ی زمانی یکسان شود.

رابط کاربری گوگل آنالیتیکس و رابط برنامه‌نویسی داده (Data API) هر دو از تنظیمات هویت گزارش‌دهی یکسانی برای دارایی شما استفاده می‌کنند. اگر این تنظیم تغییر کند، بر گزارش‌ها در رابط کاربری و رابط برنامه‌نویسی تأثیر می‌گذارد. اگر این تنظیم بین اجرای یک گزارش در رابط کاربری و دریافت داده‌های گزارش از طریق API تغییر کند، ممکن است تعداد کاربران بین دو گزارش برای یک محدوده تاریخی یکسان متفاوت باشد.

ویژگی پرس و جو

برای به حداقل رساندن اختلافات، اطمینان حاصل کنید که پارامترهای زیر در درخواست API شما دقیقاً با تنظیمات گزارش رابط کاربری گوگل آنالیتیکس مطابقت دارند:

  • محدوده‌های تاریخ : تأیید کنید که تاریخ شروع و پایان یکسان باشند.
  • ابعاد و معیارها : اطمینان حاصل کنید که ابعاد و معیارهای موجود در درخواست API شما با ابعاد و معیارهای موجود در گزارش رابط کاربری گوگل آنالیتیکس یکسان باشند.
  • فیلترها : مطمئن شوید که هر فیلتر ابعادی یا متریکی که در درخواست API اعمال می‌شود، با فیلترهای استفاده شده در رابط کاربری مطابقت دارد.

افزودن ابعاد به یک گزارش می‌تواند منجر به کاهش رویدادهای مورد استفاده در محاسبات شود. فقط رویدادهایی که حاوی داده‌هایی برای ابعاد درخواستی هستند در گزارش گنجانده می‌شوند. در نتیجه، افزودن ابعاد به یک پرس‌وجو می‌تواند مقادیر تجمیع‌شده برای معیارها در یک گزارش را تغییر دهد.

تازگی داده‌ها

گوگل آنالیتیکس برای پردازش و جمع‌آوری داده‌های رویداد زمان می‌برد. هنگام کار با داده‌های بسیار جدید، اگر بین بازیابی داده‌ها تأخیر زمانی وجود داشته باشد، ممکن است تفاوت‌های جزئی بین گزارش‌ها مشاهده کنید. به عنوان مثال، اگر گزارشی را در رابط کاربری مشاهده کنید و سپس دقایقی بعد از API برای همان گزارش پرس و جو کنید، ممکن است داده‌ها به دلیل پردازش و جمع‌آوری مداوم تغییر کرده باشند.

برای اطلاعات بیشتر، به تازگی داده‌ها مراجعه کنید.

جایگزین‌های داده‌های نمونه‌برداری نشده

اگر مورد استفاده شما به داده‌های کامل و نمونه‌برداری نشده در سطح رویداد نیاز دارد، استفاده از گزینه‌های زیر را در نظر بگیرید:

  • خروجی BigQuery : خروجی BigQuery برای گوگل آنالیتیکس

    روش پیشنهادی برای تجزیه و تحلیل پیشرفته داده‌های خام رویداد است.

  • آنالیتیکس ۳۶۰ : املاک دارای مجوز آنالیتیکس ۳۶۰ محدودیت‌های نمونه‌گیری بالاتری دارند و به ویژگی‌های گزارش‌دهی دقیق‌تری دسترسی دارند.