Oczekiwania dotyczące danych do raportu

Ten przewodnik zawiera ważne informacje o danych wyświetlanych w raportach generowanych za pomocą interfejsu Google Analytics Data API. Użytkownicy często napotykają rozbieżności między danymi zwracanymi przez interfejs API (zwłaszcza przez metodę runReport) a danymi wyświetlanymi w interfejsie Google Analytics.

Próbkowanie i agregacja

Metoda interfejsu Google Analytics Data API runReport może zwracać dane próbkowane, zwłaszcza w przypadku dużych zbiorów danych lub złożonych zapytań. Interfejs Google Analytics też stosuje próbkowanie, ale konkretne wartości progowe i algorytmy mogą się różnić, co prowadzi do niewielkich różnic w raportowanych wartościach.

Aby sprawdzić, czy wyniki raportu są oparte na podzbiorze dostępnych danych, sprawdź pole samplingMetadatas obiektu ResponseMetaData. Jeśli wyniki raportu są próbkowane, to pole zawiera procent zdarzeń użytych w tym raporcie.

Niektóre metody raportowania interfejsu Google Analytics Data API umożliwiają określenie wybranego poziomu próbkowania. Aby kontrolować poziom próbkowania raportu, możesz użyć pola samplingLevel metody properties.reportTasks.create.

Ta funkcja zapewnia usługom w Google Analytics 360 dostęp do wyższych limitów próbkowania wynoszących 1 mld zdarzeń. Limity próbkowania można też ustawić na UNSAMPLED, aby w przypadku dużej liczby zdarzeń używać wyników bez próbkowania.

Więcej informacji znajdziesz w artykule Informacje o próbkowaniu danych.

Przybliżona liczba unikalnych użytkowników

Interfejs Google Analytics Data API używa algorytmu HyperLogLog++ (HLL++) do szacowania unikalnych wartości liczbowych w przypadku danych takich jak Aktywni użytkownicy i Sesje. To podejście jest stosowane w interfejsie API i interfejsie Google Analytics, aby zwiększyć wydajność i efektywnie zarządzać dużymi zbiorami danych. Oznacza to, że wyniki są przybliżone, a nie dokładne.

Więcej informacji znajdziesz w tych artykułach: Przybliżona liczba unikalnych użytkowników w Google AnalyticsRóżnice w liczbie użytkowników.

Progi ilości danych

Google Analytics może stosować w raportach wyznaczanie wartości progowych danych, aby uniemożliwić identyfikację poszczególnych użytkowników na podstawie danych demograficznych, zainteresowań lub innych sygnałów występujących w tych danych.

Jeśli wiersz raportu zawiera niewielką liczbę użytkowników, może zostać wykluczony z wyników. Jest to częstsze w przypadku raportów, które zawierają wymiary o wysokiej kardynalności lub wymiary niestandardowe.

Aby sprawdzić, czy ten raport podlega progowaniu, sprawdź pole subjectToThresholding obiektu ResponseMetaData.

Więcej informacji znajdziesz w sekcji Wartości progowe danych.

Wiersz (other)

Jeśli wymiar ma dużą moc zbioru, Google Analytics może grupować rzadsze wartości w wierszu oznaczonym jako (other). Jest to częstsze w przypadku raportów, które zawierają wymiary z ponad 500 unikalnymi wartościami dziennie.

Pamiętaj, że podczas używania filtrów w interfejsie Data API filtry nie sprawdzają zawartości wiersza (other) i są stosowane po zagregowaniu danych i wygenerowaniu wiersza (other).

Aby sprawdzić, czy raport zawiera dane zrolowane do wiersza (other), sprawdź pole dataLossFromOtherRow obiektu ResponseMetaData.

Więcej informacji znajdziesz w artykule Wiersz „(inne)” w Google Analytics 4.

Tożsamość na potrzeby raportowania

Tożsamość na potrzeby raportowania określa sposób usuwania duplikatów użytkowników w raportach. Różne ustawienia tożsamości (np. „Mieszane” lub „Na podstawie urządzenia”) mogą powodować różne liczby użytkowników w tym samym zakresie dat.

Zarówno interfejs Google Analytics, jak i interfejs Data API używają tego samego ustawienia tożsamości na potrzeby raportowania w usłudze. Jeśli to ustawienie zostanie zmienione, wpłynie to na raporty w interfejsie i interfejsie API. Jeśli ustawienie zostanie zmienione między uruchomieniem raportu w interfejsie a pobraniem danych raportu przez interfejs API, liczba użytkowników w tych 2 raportach może się różnić w przypadku tego samego zakresu dat.

Specyficzność zapytania

Aby zminimalizować rozbieżności, upewnij się, że te parametry w żądaniu API są dokładnie zgodne z ustawieniami w raporcie interfejsu Google Analytics:

  • Zakresy dat: sprawdź, czy daty rozpoczęcia i zakończenia są identyczne.
  • Wymiary i dane: upewnij się, że wymiary i dane w żądaniu API są takie same jak wymiary i dane w raporcie w interfejsie Google Analytics.
  • Filtry: upewnij się, że wszystkie filtry wymiarów lub danych zastosowane w żądaniu do interfejsu API są zgodne z filtrami używanymi w interfejsie.

Dodanie wymiarów do raportu może spowodować, że w obliczeniach będzie używanych mniej zdarzeń. W raporcie uwzględniane są tylko zdarzenia, które zawierają dane dotyczące wybranych wymiarów. W rezultacie dodanie wymiarów do zapytania może zmienić zagregowane wartości danych w raporcie.

Częstotliwość aktualizacji danych

Google Analytics potrzebuje czasu na przetworzenie i zagregowanie danych zdarzeń. Podczas pracy z najnowszymi danymi możesz zauważyć niewielkie różnice między raportami, jeśli występuje opóźnienie między pobieraniem danych. Jeśli na przykład wyświetlisz raport w interfejsie, a potem po kilku minutach wyślesz do interfejsu API zapytanie o ten sam raport, dane mogą się zmienić z powodu trwającego przetwarzania i agregacji.

Więcej informacji znajdziesz w artykule Częstotliwość aktualizacji danych.

Alternatywy dla danych niespróbkowanych

Jeśli w Twoim przypadku potrzebne są pełne, niepróbkowane dane na poziomie zdarzenia, rozważ użycie tych alternatywnych rozwiązań:

  • BigQuery Export: BigQuery Export dla Google Analytics

    to zalecana metoda zaawansowanej analizy nieprzetworzonych danych zdarzeń.

  • Analytics 360: usługi z licencją Analytics 360 mają wyższe limity próbkowania i dostęp do bardziej szczegółowych funkcji raportowania.