Attentes concernant les données de reporting

Ce guide fournit des informations importantes sur les données que vous voyez dans les rapports générés à l'aide de l'API Google Analytics Data. Les utilisateurs rencontrent souvent des écarts entre les données renvoyées par l'API (plus précisément la méthode runReport) et celles affichées dans l'UI Google Analytics.

Échantillonnage et agrégation

La méthode runReport de l'API Google Analytics Data peut renvoyer des données échantillonnées, en particulier pour les ensembles de données volumineux ou les requêtes complexes. Bien que l'interface utilisateur de Google Analytics applique également l'échantillonnage, les seuils et les algorithmes spécifiques peuvent différer, ce qui entraîne de légères différences dans les valeurs rapportées.

Pour savoir si les résultats du rapport sont basés sur un sous-ensemble des données disponibles, examinez le champ samplingMetadatas de l'objet ResponseMetaData. Si les résultats du rapport sont échantillonnés, ce champ décrit le pourcentage d'événements utilisés dans ce rapport.

Certaines méthodes de création de rapports de l'API Google Analytics Data vous permettent de spécifier le niveau d'échantillonnage souhaité. Vous pouvez utiliser le champ samplingLevel de la méthode properties.reportTasks.create pour contrôler le niveau d'échantillonnage du rapport.

Cette fonctionnalité permet aux propriétés Google Analytics 360 d'accéder à des limites d'échantillonnage plus élevées (1 milliard d'événements). Vous pouvez également définir des limites d'échantillonnage sur UNSAMPLED pour utiliser des résultats non échantillonnés pour un grand nombre d'événements.

Pour en savoir plus, consultez À propos de l'échantillonnage des données.

Approximation du nombre unique

L'API Data Google Analytics utilise l'algorithme HyperLogLog++ (HLL++) pour estimer les nombres uniques pour des métriques telles que "Utilisateurs actifs" et "Sessions". Cette approche est utilisée dans l'API et l'interface utilisateur Google Analytics pour améliorer les performances et gérer efficacement les grands ensembles de données. Cela signifie que les résultats sont des approximations plutôt que des nombres exacts.

Pour plus de contexte, consultez les ressources suivantes : Approximation du nombre unique dans Google Analytics et Différences au niveau du nombre d'utilisateurs.

Seuils de données

Google Analytics peut appliquer des seuils de données aux rapports pour empêcher l'identification d'utilisateurs spécifiques en fonction des données démographiques, des centres d'intérêt ou d'autres signaux présents dans les données.

Si une ligne de rapport contient un petit nombre d'utilisateurs, elle peut être exclue des résultats. Cela se produit plus souvent dans les rapports qui incluent des dimensions à forte cardinalité ou des dimensions personnalisées.

Pour savoir si ce rapport est soumis à un seuil, examinez le champ subjectToThresholding de l'objet ResponseMetaData.

Pour en savoir plus, consultez Seuils de données.

Ligne (other)

Si une dimension a une forte cardinalité, Google Analytics peut regrouper les valeurs les moins courantes dans une ligne intitulée (other). Ce problème est plus fréquent dans les rapports qui incluent des dimensions avec plus de 500 valeurs uniques par jour.

Lorsque vous utilisez des filtres avec l'API Data, notez que les filtres ne recherchent pas dans la ligne (other) et sont appliqués après l'agrégation des données et la génération de la ligne (other).

Pour savoir si un rapport contient des données regroupées dans la ligne (other), inspectez le champ dataLossFromOtherRow de l'objet ResponseMetaData.

Pour en savoir plus, consultez Ligne "(autre)" dans Google Analytics 4.

Identification des utilisateurs des rapports

L'identité pour le reporting détermine comment les utilisateurs sont dédupliqués dans les rapports. Des paramètres d'identité différents (comme "Mixte" ou "Basé sur l'appareil") peuvent entraîner des nombres d'utilisateurs différents pour la même période.

L'UI Google Analytics et l'API Data utilisent le même paramètre d'identité de reporting pour votre propriété. Si vous modifiez ce paramètre, cela aura une incidence sur les rapports dans l'UI et l'API. Si le paramètre est modifié entre l'exécution d'un rapport dans l'UI et l'obtention des données du rapport via l'API, le nombre d'utilisateurs peut différer entre les deux rapports pour la même plage de dates.

Spécificité de la requête

Pour minimiser les écarts, assurez-vous que les paramètres suivants de votre requête API correspondent précisément aux paramètres du rapport de l'interface utilisateur Google Analytics :

  • Plages de dates : vérifiez que les dates de début et de fin sont identiques.
  • Dimensions et métriques : assurez-vous que les dimensions et les métriques de votre requête d'API sont identiques à celles du rapport de l'UI Google Analytics.
  • Filtres : assurez-vous que les filtres de dimensions ou de métriques appliqués dans la requête API correspondent à ceux utilisés dans l'UI.

L'ajout de dimensions à un rapport peut entraîner une diminution du nombre d'événements utilisés dans les calculs. Seuls les événements contenant des données pour les dimensions demandées sont inclus dans un rapport. Par conséquent, l'ajout de dimensions à une requête peut modifier les valeurs agrégées des métriques dans un rapport.

Fraîcheur des données

Google Analytics a besoin de temps pour traiter et agréger les données d'événement. Lorsque vous travaillez avec des données très récentes, vous pouvez constater de légères différences entre les rapports s'il existe un décalage horaire entre les récupérations de données. Par exemple, si vous consultez un rapport dans l'UI, puis que vous interrogez l'API pour le même rapport quelques minutes plus tard, les données peuvent avoir changé en raison du traitement et de l'agrégation en cours.

Pour en savoir plus, consultez Fraîcheur des données.

Alternatives aux données non échantillonnées

Si votre cas d'utilisation nécessite des données complètes, non échantillonnées et au niveau des événements, envisagez d'utiliser les alternatives suivantes :

  • BigQuery Export : BigQuery Export pour Google Analytics

    est la méthode recommandée pour l'analyse avancée des données brutes sur les événements.

  • Analytics 360 : les propriétés disposant d'une licence Analytics 360 sont soumises à des limites d'échantillonnage plus élevées et ont accès à des fonctionnalités de reporting plus détaillées.