Questa guida spiega informazioni importanti sui dati visualizzati nei report
generati utilizzando l'API di dati di Google Analytics. Gli utenti spesso riscontrano
discrepanze tra i dati restituiti dall'API (in particolare il
metodo runReport) e i dati visualizzati nell'interfaccia utente di Google Analytics.
Campionamento e aggregazione
Il metodo dell'API Google Analytics Data runReport può restituire dati campionati,
soprattutto per set di dati di grandi dimensioni o query complesse. Sebbene anche l'interfaccia utente di Google Analytics applichi il campionamento, le soglie e gli algoritmi specifici possono differire, il che comporta lievi differenze nei valori riportati.
Per capire se i risultati del report si basano su un sottoinsieme dei dati disponibili, esamina il campo samplingMetadatas dell'oggetto ResponseMetaData. Se i risultati del report vengono campionati,
questo campo descrive la percentuale di eventi utilizzati nel report.
Alcuni metodi di generazione dei report dell'API di dati di Google Analytics ti consentono di
specificare il livello di campionamento che preferisci. Puoi utilizzare il campo
samplingLevel
del metodo properties.reportTasks.create
per controllare il livello di campionamento del report.
Questa funzionalità consente alle proprietà Google Analytics 360 di accedere a limiti di campionamento più elevati, pari a 1 miliardo di eventi. Inoltre, i limiti di campionamento possono essere impostati su UNSAMPLED
per utilizzare i risultati non campionati per un numero elevato di eventi.
Per saperne di più, consulta Informazioni sul campionamento dei dati.
Approssimazione del conteggio unico
L'API Google Analytics Data utilizza l'algoritmo HyperLogLog++ (HLL++) per stimare i conteggi unici per metriche come Utenti attivi e Sessioni. Questo approccio viene utilizzato nell'API e nell'interfaccia utente di Google Analytics per migliorare il rendimento e gestire in modo efficiente i grandi set di dati, il che significa che i risultati sono approssimazioni anziché conteggi esatti.
Per ulteriori informazioni, consulta le seguenti risorse: Approssimazione del conteggio unico in Google Analytics e Differenze nei conteggi degli utenti.
Soglie di dati
Google Analytics può applicare le soglie di dati ai report per impedire l'identificazione di singoli utenti in base a dati demografici, interessi o altri indicatori all'interno dei dati.
Se una riga del report contiene un numero ridotto di utenti, potrebbe essere esclusa dai risultati. Questo è più comune nei report che includono dimensioni ad alta cardinalità o dimensioni personalizzate.
Per capire se questo report è soggetto a soglie, esamina il campo
subjectToThresholding
dell'oggetto ResponseMetaData.
Per maggiori informazioni, consulta la sezione Soglie di dati.
Riga (other)
Se una dimensione ha una cardinalità elevata, Google Analytics potrebbe raggruppare i valori meno comuni in una riga etichettata come (other). Questo è più comune nei report
che includono dimensioni con più di 500 valori unici al giorno.
Quando utilizzi i filtri con l'API Data, tieni presente che i filtri non esaminano la riga (other) e vengono applicati dopo l'aggregazione dei dati e la generazione della riga (other).
Per capire se un report contiene dati inclusi nella riga (other), esamina il campo dataLossFromOtherRow dell'oggetto ResponseMetaData.
Per ulteriori informazioni, consulta Riga(altro) in Google Analytics 4.
Identità rapporti
L'identità report determina la modalità di deduplicazione degli utenti nei report. Impostazioni dell'identità diverse (ad esempio "Mista" o "Basata sul dispositivo") possono comportare conteggi degli utenti diversi per lo stesso intervallo di date.
Sia l'interfaccia utente di Google Analytics sia l'API Data utilizzano la stessa impostazione dell'identità report per la tua proprietà. Se questa impostazione viene modificata, influirà sui report sia nell'interfaccia utente che nell'API. Se l'impostazione viene modificata tra l'esecuzione di un report nell'interfaccia utente e l'ottenimento dei dati del report tramite l'API, i conteggi degli utenti potrebbero differire tra i due report per lo stesso intervallo di date.
Specificità della query
Per ridurre al minimo le discrepanze, assicurati che i seguenti parametri nella richiesta API corrispondano esattamente alle impostazioni nel report dell'interfaccia utente di Google Analytics:
- Intervalli di date: verifica che le date di inizio e di fine siano identiche.
- Dimensioni e metriche: assicurati che le dimensioni e le metriche nella richiesta API siano le stesse del report nell'interfaccia utente di Google Analytics.
- Filtri: assicurati che i filtri per dimensioni o metriche applicati nella richiesta API corrispondano a quelli utilizzati nella UI.
L'aggiunta di dimensioni a un report può comportare l'utilizzo di un numero inferiore di eventi nei calcoli. In un report vengono inclusi solo gli eventi che contengono dati per le dimensioni richieste. Di conseguenza, l'aggiunta di dimensioni a una query può alterare i valori aggregati delle metriche in un report.
Aggiornamento dei dati
Google Analytics impiega del tempo per elaborare e aggregare i dati sugli eventi. Quando lavori con dati molto recenti, potresti notare piccole differenze tra i report se si verifica un ritardo tra i recuperi dei dati. Ad esempio, se visualizzi un report nella UI e poi esegui una query sull'API per lo stesso report pochi minuti dopo, i dati potrebbero essere cambiati a causa dell'elaborazione e dell'aggregazione in corso.
Per saperne di più, consulta Aggiornamento dei dati.
Alternative ai dati non campionati
Se il tuo caso d'uso richiede dati completi, non campionati e a livello di evento, valuta la possibilità di utilizzare le seguenti alternative:
BigQuery Export: BigQuery Export per Google Analytics
è il metodo consigliato per l'analisi avanzata dei dati sugli eventi non elaborati.
Analytics 360: le proprietà con una licenza Analytics 360 hanno limiti di campionamento più elevati e accesso a funzionalità di generazione di report più dettagliate.