توقّعات بيانات التقارير

يوضّح هذا الدليل معلومات مهمة حول البيانات التي تظهر في التقارير التي يتم إنشاؤها باستخدام Google Analytics Data API. يواجه المستخدمون غالبًا اختلافات بين البيانات التي تعرضها واجهة برمجة التطبيقات (خاصةً الطريقة runReport) والبيانات المعروضة في واجهة مستخدم "إحصاءات Google".

أخذ العيّنات وتجميع البيانات

يمكن أن تعرض طريقة runReport في Google Analytics Data API بيانات مستندة إلى عيّنات، لا سيّما لمجموعات البيانات الكبيرة أو طلبات البحث المعقّدة. على الرغم من أنّ واجهة مستخدم "إحصاءات Google" تستخدم أيضًا أخذ العيّنات، يمكن أن تختلف الحدود الدنيا والخوارزميات المحدّدة، ما يؤدّي إلى اختلافات طفيفة في القيم المعروضة.

لمعرفة ما إذا كانت نتائج التقرير تستند إلى مجموعة فرعية من البيانات المتاحة، افحص الحقل samplingMetadatas الخاص بالكائن ResponseMetaData. إذا تم أخذ عيّنات من نتائج التقرير، يوضّح هذا الحقل النسبة المئوية للأحداث المستخدَمة في هذا التقرير.

تتيح لك بعض طرق إعداد التقارير في Google Analytics Data API تحديد مستوى تحليل العيّنات الذي تريده. يمكنك استخدام الحقل samplingLevel في طريقة properties.reportTasks.create للتحكّم في مستوى أخذ العيّنات للتقرير.

تتيح هذه الميزة لمواقع "إحصاءات Google‏ 360" الوصول إلى حدود أعلى لأخذ العيّنات تبلغ مليار حدث. يمكن أيضًا ضبط حدود أخذ العيّنات على UNSAMPLED لاستخدام النتائج غير المستندة إلى عيّنات لأعداد الأحداث الكبيرة.

لمزيد من المعلومات، اطّلِع على المقالة لمحة عن تحليل عينات البيانات.

تقريب عدد القيم الفريدة

تستخدِم Google Analytics Data API خوارزمية HyperLogLog++‎ (اختصارًا HLL++‎) لتقدير الأعداد الفريدة للمقاييس، مثل "المستخدِمون النشطون" و"الجلسات". يتم استخدام هذه الطريقة في واجهة برمجة التطبيقات وواجهة مستخدم "إحصاءات Google" لتحسين الأداء وإدارة مجموعات البيانات الكبيرة بكفاءة، ما يعني أنّ النتائج هي تقديرات وليست أعدادًا دقيقة.

للحصول على سياق إضافي، يُرجى الرجوع إلى المَرجِعَين التاليَين: تقريب الأعداد الفريدة في "إحصاءات Google" و الاختلافات في أعداد المستخدمين.

حدّ البيانات

قد تطبّق "إحصاءات Google" حدودًا دنيا على البيانات في التقارير لمنع تحديد هوية مستخدمين فرديين بناءً على الخصائص الديمغرافية أو الاهتمامات أو الإشارات الأخرى المتوفّرة في البيانات.

إذا كان أحد صفوف التقرير يتضمّن عددًا قليلاً من المستخدمين، قد يتم استبعاد هذا الصف من النتائج. ويشيع ذلك في التقارير التي تتضمّن سمات أو سمات مخصّصة ذات عدد كبير من القيم الفريدة.

لمعرفة ما إذا كان هذا التقرير يخضع لحدّ الحماية، افحص الحقل subjectToThresholding للكائن ResponseMetaData.

لمزيد من المعلومات، اطّلِع على الحدّ الأدنى للبيانات.

الصف (other)

إذا كانت إحدى السمات تتضمّن عددًا كبيرًا من القيم الفريدة، قد تجمع "إحصاءات Google" القيم الأقل شيوعًا في صفّ يحمل التصنيف (other). ويشيع ذلك في التقارير التي تتضمّن سمات لها أكثر من 500 قيمة فريدة في اليوم.

عند استخدام الفلاتر مع Data API، يُرجى العِلم أنّ الفلاتر لا تبحث داخل الصف (other)، ويتم تطبيقها بعد تجميع البيانات وإنشاء الصف (other).

لمعرفة ما إذا كان التقرير يتضمّن بيانات مجمّعة في الصف (other)، افحص الحقل dataLossFromOtherRow للكائن ResponseMetaData.

لمزيد من المعلومات، اطّلِع على مقالة صفّ "غير ذلك" في "إحصاءات Google‏ 4".

المعلومات التعريفية في التقارير

تحدّد المعلومات التعريفية في التقارير كيفية إزالة تكرار المستخدمين في التقارير. يمكن أن تؤدي إعدادات الهوية المختلفة (مثل "مدمجة" أو "مستندة إلى الجهاز") إلى اختلاف أعداد المستخدمين للنطاق الزمني نفسه.

تستخدِم كلّ من واجهة مستخدم "إحصاءات Google" وData API إعدادات المعلومات التعريفية في التقارير نفسها لموقعك. في حال تغيير هذا الإعداد، سيؤثّر ذلك في التقارير في كلّ من واجهة المستخدم وواجهة برمجة التطبيقات. في حال تغيير الإعداد بين عرض تقرير في واجهة المستخدم والحصول على بيانات التقرير من خلال واجهة برمجة التطبيقات، قد تختلف أعداد المستخدمين بين التقريرَين للنطاق الزمني نفسه.

دقة طلب البحث

للحدّ من التفاوتات، تأكَّد من أنّ المَعلمات التالية في طلب واجهة برمجة التطبيقات تتطابق تمامًا مع الإعدادات في تقرير واجهة مستخدم "إحصاءات Google":

  • النطاقات الزمنية: تأكَّد من تطابق تاريخَي البدء والانتهاء.
  • السمات والمقاييس: تأكَّد من أنّ السمات والمقاييس في طلب واجهة برمجة التطبيقات هي نفسها السمات والمقاييس في تقرير واجهة مستخدم "إحصاءات Google".
  • الفلاتر: تأكَّد من أنّ أي فلاتر للسمات أو المقاييس يتم تطبيقها في طلب بيانات من واجهة برمجة التطبيقات تتطابق مع تلك المستخدَمة في واجهة المستخدم.

يمكن أن تؤدي إضافة سمات إلى تقرير إلى تقليل عدد الأحداث المستخدَمة في العمليات الحسابية. لا يتم تضمين سوى الأحداث التي تحتوي على بيانات للسمات المطلوبة في التقرير. نتيجةً لذلك، يمكن أن تؤدي إضافة سمات إلى طلب بحث إلى تغيير القيم المجمّعة للمقاييس في التقرير.

حداثة البيانات

تستغرق "إحصاءات Google" وقتًا لمعالجة بيانات الأحداث وتجميعها. عند العمل باستخدام بيانات حديثة جدًا، قد تلاحظ اختلافات طفيفة بين التقارير إذا كان هناك تأخير زمني بين عمليات استرجاع البيانات. على سبيل المثال، إذا اطّلعت على تقرير في واجهة المستخدِم ثم طلبت التقرير نفسه من واجهة برمجة التطبيقات بعد دقائق، قد تكون البيانات قد تغيّرت بسبب استمرار المعالجة والتجميع.

لمزيد من المعلومات، يُرجى الاطّلاع على مقالة حداثة البيانات.

بدائل البيانات غير المستندة إلى عينات

إذا كانت حالة استخدامك تتطلّب بيانات كاملة وغير مأخوذة من عيّنات على مستوى الحدث، ننصحك باستخدام البدائل التالية:

  • BigQuery Export: ميزة BigQuery Export في "إحصاءات Google"

    هي الطريقة المقترَحة لإجراء تحليل متقدّم لبيانات الأحداث الأولية.

  • إحصاءات 360: تفرض المواقع التي تتضمّن ترخيص "إحصاءات 360" حدودًا أعلى لأخذ العيّنات وتتيح الوصول إلى ميزات إعداد التقارير الأكثر تفصيلاً.