Questa guida fornisce informazioni importanti sui dati visualizzati nei report generati utilizzando l'API di dati di Google Analytics. Gli utenti spesso riscontrano discrepanze tra i dati restituiti dall'API (in particolare dal metodo runReport) e i dati mostrati nell'interfaccia utente di Google Analytics.
Campionamento e aggregazione
Il metodo runReport dell'API di dati di Google Analytics può restituire dati campionati, in particolare per set di dati di grandi dimensioni o query complesse. Sebbene anche l'interfaccia utente di Google Analytics applichi il campionamento, le soglie e gli algoritmi specifici possono variare, il che comporta piccole differenze nei valori riportati.
Per capire se i risultati del report si basano su un sottoinsieme dei
dati disponibili, esamina il
samplingMetadatas
campo dell'oggetto ResponseMetaData. Se i risultati del report sono campionati, questo campo descrive la percentuale di eventi utilizzati nel report.
Alcuni metodi di generazione di report dell'API di dati di Google Analytics consentono di specificare il livello di campionamento desiderato. Puoi utilizzare il
samplingLevel
campo del metodo properties.reportTasks.create
per controllare il livello di campionamento del report.
Questa funzionalità consente alle proprietà Google Analytics 360 di accedere a limiti di campionamento più elevati, pari a 1 miliardo di eventi. Inoltre, i limiti di campionamento possono essere impostati su UNSAMPLED per utilizzare risultati non campionati per conteggi di eventi di grandi dimensioni.
Per ulteriori informazioni, consulta Informazioni sul campionamento dei dati.
Approssimazione del conteggio unico
L'API di dati di Google Analytics utilizza l'algoritmo HyperLogLog++ (HLL++) per stimare i conteggi unici per metriche come Utenti attivi e Sessioni. Questo approccio viene utilizzato nell'API e nell'interfaccia utente di Google Analytics per migliorare le prestazioni e gestire in modo efficiente set di dati di grandi dimensioni, il che significa che i risultati sono approssimazioni anziché conteggi esatti.
Per ulteriori informazioni, consulta le seguenti risorse: Approssimazione del conteggio unico in Google Analytics e Differenze nei conteggi degli utenti.
Soglie di dati
Google Analytics potrebbe applicare soglie di dati ai report per impedire l'identificazione di singoli utenti in base a dati demografici, interessi o altri indicatori all'interno dei dati.
Se una riga del report contiene un numero ridotto di utenti, potrebbe essere esclusa dai risultati. Questo è più comune nei report che includono dimensioni ad alta cardinalità o dimensioni personalizzate.
Per capire se questo report è soggetto a soglie, esamina il
subjectToThresholding
campo dell'oggetto ResponseMetaData.
Per ulteriori informazioni, consulta Soglie di dati.
La riga (other)
Se una dimensione ha una cardinalità elevata, Google Analytics potrebbe raggruppare i valori meno comuni in una riga etichettata come (other). Questo è più comune nei report che includono dimensioni con più di 500 valori unici al giorno.
Quando utilizzi i filtri con l'API di dati, tieni presente che i filtri non esaminano la riga (other) e vengono applicati dopo l'aggregazione dei dati e la generazione della riga (other).
Per capire se un report contiene dati aggregati nella riga (other),
esamina il
dataLossFromOtherRow
campo dell'oggetto ResponseMetaData.
Per ulteriori informazioni, consulta La riga(other) in Google Analytics.
Identità report
L'identità report determina la modalità di deduplicazione degli utenti nei report. Impostazioni di identità diverse (ad esempio "Mista" o "Basata sul dispositivo") possono comportare conteggi degli utenti diversi per lo stesso intervallo di date.
Sia l'interfaccia utente di Google Analytics sia l'API di dati utilizzano la stessa impostazione di identità report per la tua proprietà. Se questa impostazione viene modificata, influirà sui report sia nell'interfaccia utente sia nell'API. Se l'impostazione viene modificata tra l'esecuzione di un report nell'interfaccia utente e l'ottenimento dei dati del report tramite l'API, i conteggi degli utenti potrebbero variare tra i due report per lo stesso intervallo di date.
Specificità della query
Per ridurre al minimo le discrepanze, assicurati che i seguenti parametri nella richiesta API corrispondano esattamente alle impostazioni nel report dell'interfaccia utente di Google Analytics:
- Intervalli di date: verifica che le date di inizio e di fine siano identiche.
- Dimensioni e metriche: assicurati che le dimensioni e le metriche nella richiesta API siano le stesse del report dell'interfaccia utente di Google Analytics.
- Filtri: assicurati che tutti i filtri di dimensioni o metriche applicati nella richiesta API corrispondano a quelli utilizzati nell'interfaccia utente.
L'aggiunta di dimensioni a un report può comportare un minor numero di eventi utilizzati nei calcoli. In un report vengono inclusi solo gli eventi che contengono dati per le dimensioni richieste. Di conseguenza, l'aggiunta di dimensioni a una query può modificare i valori aggregati delle metriche in un report.
Aggiornamento dei dati
Google Analytics impiega del tempo per elaborare e aggregare i dati sugli eventi. Quando lavori con dati molto recenti, potresti notare piccole differenze tra i report se si verifica un ritardo tra i recuperi dei dati. Ad esempio, se visualizzi un report nell'interfaccia utente e poi esegui una query sull'API per lo stesso report pochi minuti dopo, i dati potrebbero essere cambiati a causa dell'elaborazione e dell'aggregazione in corso.
Per ulteriori informazioni, consulta Aggiornamento dei dati.
Alternative ai dati non campionati
Se il tuo caso d'uso richiede dati a livello di evento completi e non campionati, valuta la possibilità di utilizzare le seguenti alternative:
BigQuery Export: BigQuery Export per Google Analytics
è il metodo consigliato per l'analisi avanzata dei dati sugli eventi non elaborati.
Analytics 360: le proprietà con una licenza Analytics 360 hanno limiti di campionamento più elevati e accesso a funzionalità di generazione di report più dettagliate.