Este guia explica informações importantes sobre os dados que aparecem nos relatórios gerados usando a API Google Analytics Data. Os usuários costumam encontrar discrepâncias entre os dados retornados pela API (especificamente o método runReport) e os dados mostrados na interface do Google Analytics.
Amostragem e agregação
O método runReport da API Google Analytics Data pode retornar dados de amostra, especialmente para conjuntos de dados grandes ou consultas complexas. Embora a interface do Google Analytics também aplique a amostragem, os limites e algoritmos específicos podem ser diferentes, levando a pequenas diferenças nos valores informados.
Para entender se os resultados do relatório são baseados em um subconjunto dos
dados disponíveis, inspecione o
samplingMetadatas
campo do objeto ResponseMetaData. Se os resultados do relatório forem amostrados, esse campo descreverá a porcentagem de eventos usados nele.
Alguns métodos de relatórios da API Google Analytics Data permitem especificar o nível de amostragem desejado. Você pode usar o
samplingLevel
campo do método properties.reportTasks.create
para controlar o nível de amostragem do relatório.
Esse recurso oferece às propriedades do Google Analytics 360 acesso a limites de amostragem mais altos de 1 bilhão de eventos. Além disso, os limites de amostragem podem ser definidos como UNSAMPLED para usar resultados não amostrados em grandes contagens de eventos.
Para mais informações, consulte Sobre a amostragem de dados.
Aproximação da contagem exclusiva
A API Google Analytics Data usa o algoritmo HyperLogLog++ (HLL++) para estimar contagens exclusivas de métricas como usuários ativos e sessões. Essa abordagem é usada na API e na interface do Google Analytics para melhorar a performance e gerenciar conjuntos de dados grandes com eficiência, o que significa que os resultados são aproximações, e não contagens exatas.
Para mais contexto, consulte os seguintes recursos: Aproximação da contagem exclusiva no Google Analytics e Diferenças nas contagens de usuários.
Limites de dados
O Google Analytics pode aplicar limites de dados aos relatórios para evitar a identificação de usuários individuais com base em dados demográficos, interesses ou outros indicadores presentes nos dados.
Se uma linha de relatório contiver um pequeno número de usuários, ela poderá ser excluída dos resultados. Isso é mais comum em relatórios que incluem dimensões de alta cardinalidade ou dimensões personalizadas.
Para entender se esse relatório está sujeito a limites, inspecione o
subjectToThresholding
campo do objeto ResponseMetaData.
Para mais informações, consulte Limites de dados.
A linha (other)
Se uma dimensão tiver alta cardinalidade, o Google Analytics poderá agrupar valores menos comuns em uma linha rotulada como (other). Isso é mais comum em relatórios que incluem dimensões com mais de 500 valores exclusivos por dia.
Ao usar filtros com a API Data, observe que eles não procuram dentro da linha (other) e são aplicados depois que os dados são agregados e a linha (other) é gerada.
Para entender se um relatório contém dados acumulados na linha (other),
inspecione o
dataLossFromOtherRow
campo do objeto ResponseMetaData.
Para mais informações, consulte Linha(other) no Google Analytics 4.
Identidade do relatório
A identidade do relatório decide como os usuários são desduplicados nos relatórios. Diferentes configurações de identidade (como "Combinada" ou "Baseada em dispositivo") podem resultar em contagens de usuários diferentes para o mesmo período.
A interface do Google Analytics e a API Data usam a mesma configuração de identidade do relatório para sua propriedade. Se essa configuração for alterada, ela afetará os relatórios na interface e na API. Se a configuração for alterada entre a execução de um relatório na interface e a obtenção dos dados do relatório pela API, as contagens de usuários poderão ser diferentes entre os dois relatórios para o mesmo período.
Especificidade da consulta
Para minimizar as discrepâncias, verifique se os seguintes parâmetros na solicitação da API correspondem exatamente às configurações no relatório da interface do Google Analytics:
- Períodos: verifique se as datas de início e término são idênticas.
- Dimensões e métricas: verifique se as dimensões e métricas na solicitação da API são as mesmas que as dimensões e métricas no relatório da interface do Google Analytics.
- Filtros: verifique se os filtros de dimensão ou métrica aplicados na solicitação de API correspondem aos usados na interface.
A adição de dimensões a um relatório pode resultar em menos eventos usados nos cálculos. Somente os eventos que contêm dados para as dimensões solicitadas são incluídos em um relatório. Como resultado, a adição de dimensões a uma consulta pode alterar os valores agregados das métricas em um relatório.
Atualização de dados
O Google Analytics leva tempo para processar e agregar dados de eventos. Ao trabalhar com dados muito recentes, você poderá notar pequenas diferenças entre os relatórios se houver um atraso entre as recuperações de dados. Por exemplo, se você visualizar um relatório na interface e consultar a API para o mesmo relatório minutos depois, os dados poderão ter mudado devido ao processamento e agregação em andamento.
Para mais informações, consulte Atualização de dados.
Alternativas de dados não amostrados
Se o caso de uso exigir dados completos e não amostrados no nível do evento, considere usar as seguintes alternativas:
BigQuery Export: BigQuery Export para o Google Analytics
é o método recomendado para análise avançada de dados de eventos brutos.
Analytics 360: as propriedades com uma licença do Analytics 360 têm limites de amostragem mais altos e acesso a recursos de relatórios mais detalhados.