Este guia explica informações importantes sobre os dados que aparecem nos relatórios gerados com a API Google Analytics Data. Os usuários costumam encontrar discrepâncias entre os dados retornados pela API (especificamente o método runReport) e os dados mostrados na interface do Google Analytics.
Amostragem e agregação
O método runReport da API Google Analytics Data pode retornar dados de amostra, principalmente para conjuntos de dados grandes ou consultas complexas. Embora a interface do Google Analytics também aplique a amostragem, os limites mínimos e algoritmos específicos podem ser diferentes, o que causa pequenas diferenças nos valores informados.
Para entender se os resultados do relatório se baseiam em um subconjunto dos dados disponíveis, inspecione o campo samplingMetadatas do objeto ResponseMetaData. Se os resultados do relatório forem amostrados, este campo vai descrever a porcentagem de eventos usados nele.
Alguns métodos de relatórios da API Data do Google Analytics permitem especificar o nível de amostragem desejado. Use o campo
samplingLevel
do método properties.reportTasks.create
para controlar o nível de amostragem do relatório.
Com esse recurso, as propriedades do Google Analytics 360 têm acesso a limites de amostragem mais altos, de 1 bilhão de eventos. Além disso, os limites de amostragem podem ser definidos como UNSAMPLED para usar resultados não amostrados em contagens de eventos grandes.
Para mais informações, consulte Sobre a amostragem de dados.
Aproximação da contagem única
A API de dados do Google Analytics usa o algoritmo HyperLogLog++ (HLL++) para estimar contagens exclusivas de métricas como "Usuários ativos" e "Sessões". Essa abordagem é usada na API e na interface do Google Analytics para melhorar o desempenho e gerenciar grandes conjuntos de dados com eficiência. Isso significa que os resultados são aproximações, não contagens exatas.
Para mais contexto, consulte os seguintes recursos: Estimativa da contagem única no Google Analytics e Diferenças nas contagens de usuários.
Limite de dados
O Google Analytics pode aplicar limites mínimos de dados aos relatórios para evitar a identificação de usuários individuais com base em informações demográficas, interesses ou outros indicadores presentes nos dados.
Se uma linha de relatório tiver um número pequeno de usuários, ela poderá ser excluída dos resultados. Isso é mais comum em relatórios que incluem dimensões de alta cardinalidade ou dimensões personalizadas.
Para entender se esse relatório está sujeito a um limite mínimo, inspecione o campo subjectToThresholding do objeto ResponseMetaData.
Para mais informações, consulte Limites mínimos de dados.
A linha (other)
Se uma dimensão tiver alta cardinalidade, o Google Analytics poderá agrupar valores menos comuns em uma linha rotulada como (other). Isso é mais comum em relatórios que incluem dimensões com mais de 500 valores exclusivos por dia.
Ao usar filtros com a API Data, observe que eles não procuram dentro da linha (other) e são aplicados depois que os dados são agregados e a linha (other) é gerada.
Para entender se um relatório contém dados acumulados na linha (other), inspecione o campo dataLossFromOtherRow do objeto ResponseMetaData.
Para mais informações, consulte Linha "(outros)" no Google Analytics.
Identidade do relatório
A identidade do relatório decide como os usuários são eliminados de relatórios. Configurações de identidade diferentes (como "Combinada" ou "Baseada em dispositivo") podem resultar em contagens de usuários diferentes para o mesmo período.
A interface do Google Analytics e a API Data usam a mesma configuração de identidade do relatório para sua propriedade. Se essa configuração for alterada, ela vai afetar os relatórios na interface e na API. Se a configuração for alterada entre a execução de um relatório na interface e a obtenção dos dados dele pela API, as contagens de usuários poderão ser diferentes entre os dois relatórios para o mesmo período.
Especificidade da consulta
Para minimizar as discrepâncias, verifique se os seguintes parâmetros na sua solicitação de API correspondem exatamente às configurações no relatório da interface do Google Analytics:
- Períodos: verifique se as datas de início e término são idênticas.
- Dimensões e métricas: verifique se as dimensões e métricas na solicitação da API são as mesmas do relatório na interface do Google Analytics.
- Filtros: verifique se os filtros de dimensão ou métrica aplicados na solicitação de API correspondem aos usados na interface.
Adicionar dimensões a um relatório pode resultar em menos eventos usados nos cálculos. Somente eventos que contêm dados para as dimensões solicitadas são incluídos em um relatório. Como resultado, adicionar dimensões a uma consulta pode alterar os valores agregados das métricas em um relatório.
Atualização de dados
O Google Analytics leva tempo para processar e agregar dados de eventos. Ao trabalhar com dados muito recentes, você pode notar pequenas diferenças entre os relatórios se houver um atraso entre as recuperações de dados. Por exemplo, se você consultar um relatório na interface e depois consultar a API para o mesmo relatório minutos depois, os dados poderão ter mudado devido ao processamento e agregação em andamento.
Para mais informações, consulte Atualização de dados.
Alternativas aos dados sem amostra
Se o caso de uso exigir dados completos, não coletados por amostragem e no nível do evento, considere usar as seguintes alternativas:
BigQuery Export: BigQuery Export para o Google Analytics
é o método recomendado para análise avançada de dados brutos de eventos.
Analytics 360: as propriedades com uma licença do Analytics 360 têm limites de amostragem mais altos e acesso a recursos de relatórios mais detalhados.