Expectativas sobre los datos de informes

En esta guía, se explica información importante sobre los datos que ves en los informes generados con la API de Google Analytics Data. Los usuarios suelen encontrar discrepancias entre los datos que devuelve la API (específicamente el método runReport) y los datos que se muestran en la IU de Google Analytics.

Muestreo y agregación

El método runReport de la API de Google Analytics Data puede devolver datos muestreados, especialmente para conjuntos de datos grandes o consultas complejas. Si bien la IU de Google Analytics también aplica el muestreo, los umbrales y algoritmos específicos pueden diferir, lo que genera pequeñas diferencias en los valores registrados.

Para comprender si los resultados del informe se basan en un subconjunto de los datos disponibles, inspecciona el campo samplingMetadatas del objeto ResponseMetaData. Si los resultados del informe se basan en una muestra, este campo describe el porcentaje de eventos que se usaron en el informe.

Algunos métodos de informes de la API de datos de Google Analytics te permiten especificar el nivel de muestreo que deseas. Puedes usar el campo samplingLevel del método properties.reportTasks.create para controlar el nivel de muestreo del informe.

Esta función brinda a las propiedades de Google Analytics 360 acceso a límites de muestreo más altos de 1,000 millones de eventos. Además, los límites de muestreo se pueden establecer en UNSAMPLED para usar resultados sin muestrear en el caso de grandes cantidades de eventos.

Para obtener más información, consulta Acerca del muestreo de datos.

Aproximación del recuento único

La API de Google Analytics Data utiliza el algoritmo HyperLogLog++ (HLL++) para estimar los recuentos únicos de métricas como Usuarios activos y Sesiones. Este enfoque se utiliza en la API y en la IU de Google Analytics para mejorar el rendimiento y administrar grandes conjuntos de datos de manera eficiente, lo que significa que los resultados son aproximaciones en lugar de recuentos exactos.

Para obtener más contexto, consulta los siguientes recursos: Aproximación del recuento único en Google Analytics y Diferencias en los recuentos de usuarios.

Umbralización de datos

Google Analytics puede aplicar umbrales de datos a los informes para evitar la identificación de usuarios individuales en función de datos demográficos, intereses o cualquier otro indicador presente en los datos.

Si una fila del informe contiene una pequeña cantidad de usuarios, es posible que se excluya de los resultados. Esto es más común en los informes que incluyen dimensiones de alta cardinalidad o dimensiones personalizadas.

Para saber si este informe está sujeto a umbralización, inspecciona el campo subjectToThresholding del objeto ResponseMetaData.

Para obtener más información, consulta Umbrales de datos.

La fila (other)

Si una dimensión tiene una cardinalidad alta, Google Analytics puede agrupar los valores menos comunes en una fila etiquetada como (other). Esto es más común en los informes que incluyen dimensiones con más de 500 valores únicos por día.

Cuando uses filtros con la API de Data, ten en cuenta que los filtros no buscan dentro de la fila (other) y se aplican después de que se agregan los datos y se genera la fila (other).

Para comprender si un informe contiene datos incluidos en la fila (other), inspecciona el campo dataLossFromOtherRow del objeto ResponseMetaData.

Para obtener más información, consulta la fila(otro) en Google Analytics 4.

Identidad para los informes

La identidad para los informes decide cómo se eliminan los usuarios duplicados en los informes. Los diferentes parámetros de configuración de identidad (como "Combinada" o "Basada en el dispositivo") pueden generar diferentes recuentos de usuarios para el mismo período.

Tanto la IU de Google Analytics como la API de Data usan el mismo parámetro de configuración de identidad de informes para tu propiedad. Si se cambia este parámetro de configuración, se verán afectados los informes en la IU y la API. Si el parámetro de configuración se cambia entre la ejecución de un informe en la IU y la obtención de los datos del informe a través de la API, es posible que los recuentos de usuarios difieran entre los dos informes para el mismo período.

Especificidad de la búsqueda

Para minimizar las discrepancias, asegúrate de que los siguientes parámetros de tu solicitud a la API coincidan exactamente con la configuración del informe de la IU de Google Analytics:

  • Períodos: Verifica que las fechas de inicio y finalización sean idénticas.
  • Dimensiones y métricas: Asegúrate de que las dimensiones y métricas de tu solicitud a la API sean las mismas que las dimensiones y métricas del informe de la IU de Google Analytics.
  • Filtros: Asegúrate de que los filtros de dimensiones o métricas que se apliquen en la solicitud de la API coincidan con los que se usan en la IU.

Agregar dimensiones a un informe puede generar que se usen menos eventos en los cálculos. En un informe, solo se incluyen los eventos que contienen datos para las dimensiones solicitadas. Por lo tanto, agregar dimensiones a una consulta puede alterar los valores agregados de las métricas en un informe.

Actualidad de los datos

Google Analytics tarda en procesar y agregar los datos de eventos. Cuando trabajes con datos muy recientes, es posible que veas pequeñas diferencias entre los informes si hay una demora entre las recuperaciones de datos. Por ejemplo, si ves un informe en la IU y, luego, consultas la API para obtener el mismo informe minutos después, es posible que los datos hayan cambiado debido al procesamiento y la agregación en curso.

Para obtener más información, consulta Actualidad de los datos.

Alternativas a los datos sin muestrear

Si tu caso de uso requiere datos completos, sin muestrear y a nivel del evento, considera usar las siguientes alternativas:

  • BigQuery Export: BigQuery Export para Google Analytics

    es el método recomendado para el análisis avanzado de datos de eventos sin procesar.

  • Analytics 360: Las propiedades con una licencia de Analytics 360 tienen límites de muestreo más altos y acceso a funciones de informes más detalladas.