In diesem Leitfaden finden Sie wichtige Informationen zu den Daten, die in Berichten angezeigt werden, die mit der Google Analytics Data API generiert wurden. Nutzer stellen häufig Abweichungen zwischen den von der API zurückgegebenen Daten (insbesondere der Methode runReport) und den in der Google Analytics-Benutzeroberfläche angezeigten Daten fest.
Sampling und Aggregation
Die runReport-Methode der Google Analytics Data API kann Stichprobendaten zurückgeben, insbesondere bei großen Datensätzen oder komplexen Abfragen. Auch in der Google Analytics-Benutzeroberfläche werden Stichproben verwendet. Die Grenzwerte und Algorithmen können jedoch abweichen, was zu geringfügigen Unterschieden bei den gemeldeten Werten führt.
Wenn Sie wissen möchten, ob die Ergebnisse des Berichts auf einem Teil der verfügbaren Daten basieren, sehen Sie sich das Feld samplingMetadatas des ResponseMetaData-Objekts an. Wenn die Berichtergebnisse auf Stichproben basieren, wird in diesem Feld der Prozentsatz der Ereignisse beschrieben, die in diesem Bericht verwendet wurden.
Bei bestimmten Berichtsmethoden der Google Analytics Data API können Sie die gewünschte Stichprobenebene angeben. Mit dem Feld samplingLevel der Methode properties.reportTasks.create können Sie die Stichprobenerhebung des Berichts steuern.
Mit dieser Funktion können für Google Analytics 360-Properties höhere Stichprobenlimits von 1 Milliarde Ereignissen festgelegt werden. Außerdem können Stichprobenlimits auf UNSAMPLED gesetzt werden, um bei einer großen Anzahl von Ereignissen Ergebnisse ohne Stichprobenerhebung zu verwenden.
Schätzung der Anzahl einzelner Elemente
In der Google Analytics Data API wird der HyperLogLog++-Algorithmus (HLL++) verwendet, um die Anzahl der einzelnen Werte für Messwerte wie „Aktive Nutzer“ und „Sitzungen“ zu schätzen. Dieser Ansatz wird in der API und der Google Analytics-Benutzeroberfläche verwendet, um die Leistung zu verbessern und große Datasets effizient zu verwalten. Die Ergebnisse sind also Schätzungen und keine genauen Zahlen.
Weitere Informationen finden Sie in den folgenden Artikeln: Schätzung der eindeutigen Anzahl in Google Analytics Unterschiede bei Nutzerzahlen
Grenzwert für Daten
In Google Analytics können Datengrenzwerte auf Berichte angewendet werden, um zu verhindern, dass die Identität einzelner Nutzer anhand von demografischen Merkmalen, Interessen oder anderen Datensignalen abgeleitet wird.
Wenn eine Berichtszeile nur wenige Nutzer enthält, wird sie möglicherweise aus den Ergebnissen ausgeschlossen. Das ist häufiger bei Berichten der Fall, die Dimensionen mit hoher Kardinalität oder benutzerdefinierte Dimensionen enthalten.
Wenn Sie wissen möchten, ob für diesen Bericht Schwellenwerte gelten, sehen Sie sich das Feld subjectToThresholding des ResponseMetaData-Objekts an.
Weitere Informationen finden Sie unter Datengrenzwerte.
Die Zeile (other)
Wenn eine Dimension eine hohe Kardinalität hat, werden weniger häufige Werte in Google Analytics möglicherweise in einer Zeile mit der Bezeichnung (other) zusammengefasst. Das ist häufiger in Berichten der Fall, die Dimensionen mit mehr als 500 eindeutigen Werten pro Tag enthalten.
Wenn Sie Filter mit der Data API verwenden, beachten Sie, dass Filter nicht in die (other)-Zeile einbezogen werden und nach der Aggregation der Daten und der Generierung der (other)-Zeile angewendet werden.
Wenn Sie wissen möchten, ob ein Bericht Daten enthält, die in die Zeile (other) aufgenommen wurden, sehen Sie sich das Feld dataLossFromOtherRow des ResponseMetaData-Objekts an.
Identität für die Berichterstellung
Mit der Identität für die Berichterstellung wird festgelegt, wie Nutzer in Berichten dedupliziert werden. Unterschiedliche Identitätseinstellungen (z. B. „Kombiniert“ oder „Gerätebasiert“) können für denselben Zeitraum zu unterschiedlichen Nutzerzahlen führen.
Sowohl in der Google Analytics-Benutzeroberfläche als auch in der Data API wird dieselbe Einstellung für die Identität für die Berichterstellung für Ihre Property verwendet. Wenn diese Einstellung geändert wird, wirkt sich das auf Berichte in der Benutzeroberfläche und in der API aus. Wenn die Einstellung zwischen dem Ausführen eines Berichts in der Benutzeroberfläche und dem Abrufen der Berichtsdaten über die API geändert wird, können sich die Nutzerzahlen in den beiden Berichten für denselben Zeitraum unterscheiden.
Spezifität von Anfragen
Um Abweichungen zu minimieren, müssen die folgenden Parameter in Ihrem API-Aufruf genau mit den Einstellungen im Google Analytics-Bericht übereinstimmen:
- Zeiträume: Prüfen Sie, ob Start- und Enddatum identisch sind.
- Dimensionen und Messwerte: Die Dimensionen und Messwerte in Ihrem API-Aufruf müssen mit den Dimensionen und Messwerten im Google Analytics-Bericht übereinstimmen.
- Filter: Achten Sie darauf, dass alle in der API-Anfrage angewendeten Dimensions- oder Messwertfilter mit denen in der Benutzeroberfläche übereinstimmen.
Wenn Sie einem Bericht Dimensionen hinzufügen, kann dies dazu führen, dass weniger Ereignisse für Berechnungen verwendet werden. In einem Bericht werden nur Ereignisse berücksichtigt, die Daten für die angeforderten Dimensionen enthalten. Wenn Sie einer Abfrage Dimensionen hinzufügen, können sich die aggregierten Werte für Messwerte in einem Bericht ändern.
Datenaktualität
Es dauert eine Weile, bis Ereignisdaten in Google Analytics verarbeitet und zusammengefasst werden. Wenn Sie mit sehr aktuellen Daten arbeiten, können geringfügige Unterschiede zwischen Berichten auftreten, wenn zwischen den Datenabrufen eine Zeitverzögerung besteht. Wenn Sie sich beispielsweise einen Bericht in der Benutzeroberfläche ansehen und dann Minuten später die API für denselben Bericht abfragen, haben sich die Daten aufgrund der laufenden Verarbeitung und Aggregation möglicherweise geändert.
Weitere Informationen zur Datenaktualität
Alternativen für Gesamtdaten
Wenn Sie für Ihren Anwendungsfall vollständige Daten auf Ereignisebene ohne Stichprobenerhebung benötigen, können Sie die folgenden Alternativen verwenden:
BigQuery Export: BigQuery Export für Google Analytics
ist die empfohlene Methode für die erweiterte Analyse von Rohereignisdaten.
Analytics 360: Für Properties mit einer Analytics 360-Lizenz gelten höhere Sampling-Grenzwerte und Sie haben Zugriff auf detailliertere Berichtsfunktionen.