Praca z hałasem

Dowiedz się, jak uwzględniać i ograniczać wpływ szumu w raportach zbiorczych.

Zanim zaczniesz

Zanim przejdziesz dalej, aby dowiedzieć się, czym jest szum i jego oddziaływanie, zapoznaj się z artykułem Interpretowanie szumu w raportach podsumowujących.

Twoje ustawienia szumu

Nie możesz bezpośrednio kontrolować szumu dodawanego do raportów zbiorczych, ale możesz podjąć pewne działania, aby je zminimalizować. W sekcjach poniżej opisujemy te strategie.

Skaluj w górę, aby wpłacać środki

Jak wyjaśniono w sekcji „Analiza szumu”, szum stosowany do wartości podsumowania dla każdego klucza jest oparty na skali 0–65 536 (0–CONTRIBUTION_BUDGET).

Rozkład szumu jest oparty na budżecie.

Z tego względu, aby zmaksymalizować sygnał względem szumu, musisz przeskalować każdą wartość w górę, zanim ustawisz ją jako wartość agregowaną, czyli pomnożyć każdą wartość przez określony współczynnik – współczynnik skalowania, dbając przy tym o to, aby mieściła się w budżecie darowizn.

Szum względny ze skalowaniem i bez.

Obliczanie współczynnika skalowania

Współczynnik skalowania określa, jak bardzo chcesz skalować daną wartość zagregowaną. Jego wartością powinna być suma budżetu darowizn podzielona przez maksymalną wartość agregacji określonego klucza.

Określam współczynnik skalowania na podstawie budżetu darowizn.

Załóżmy np., że reklamodawcy chcą znać łączną wartość zakupu. Wiesz,że maksymalna oczekiwana wartość zakupu pojedynczego zakupu wynosi 2000 zł z wyjątkiem kilku wyjątkowych wartości, które możesz zignorować:

  • Oblicz współczynnik skalowania:
    • Aby zmaksymalizować współczynnik sygnału do szumu, musisz przeskalować tę wartość do 65 536 (budżetu na wpłatę).
    • Daje to 65 536 / 2000 przy współczynniku skalowania około 32x. W praktyce możesz zaokrąglić ten współczynnik w górę lub w dół.
  • Przeskaluj wartości przed agregacją. Za każde 1 USD zakupu zwiększ liczbę śledzonych danych o 32. Na przykład w przypadku zakupu na kwotę 120 PLN ustaw wartość skumulowaną 120*32 = 3840.
  • Zmniejsz zakres wartości po agregacji. Po otrzymaniu raportu podsumowującego zawierającego wartość zakupu zsumowaną dla wielu użytkowników zmniejsz ją, używając współczynnika skalowania użytego przed agregacją. W naszym przykładzie użyliśmy współczynnika skalowania wynoszącego 32, więc musimy podzielić wartość podsumowania otrzymaną w raporcie podsumowującym przez 32. Dlatego jeśli łączna wartość zakupu dla danego klucza w raporcie podsumowującym wynosi 76 800, skrócona wartość zakupu (z szumem) to 76 800/32 = 2400 zł.

Podziel budżet

Jeśli masz kilka celów związanych z pomiarami – np. liczbę zakupów i wartość zakupów – warto rozdzielić budżet między te cele.

W takim przypadku współczynniki skalowania będą się różnić w przypadku różnych wartości zagregowanych, w zależności od oczekiwanej maksymalnej wartości danej zagregowanej wartości.

Szczegółowe informacje znajdziesz w sekcji Omówienie kluczy agregacji.

Załóżmy np., że śledzisz zarówno liczbę zakupów, jak i wartość zakupów oraz że decydujesz się równomiernie rozdzielić budżet.

65 536 / 2 = 32 768 można przydzielić do poszczególnych typów pomiaru i źródła.

  • Liczba zakupów:
    • Śledzisz tylko jeden zakup, więc maksymalna liczba zakupów w ramach danej konwersji wynosi 1.
    • Dlatego ustawiasz współczynnik skalowania na 32 768 / 1 = 32 768.
  • Wartość zakupu:
    • Załóżmy,że maksymalna oczekiwana wartość zakupu pojedynczego zakupu wynosi 2000 zł.
    • Dlatego ustawiasz współczynnik skalowania dla wartości zakupu na 32 768 / 2000 = 16,384, czyli około 16.

Grubojsze klucze agregacji poprawiają stosunek sygnału do szumu

Klucze przybliżone wychwytują więcej zdarzeń konwersji niż klucze szczegółowe, dlatego klucze przybliżone zazwyczaj prowadzą do wyższych wartości podsumowania.

Wyższe wartości podsumowujące w większym stopniu zależą od szumu niż mniejsze wartości. Szum w tych wartościach jest prawdopodobnie niższy w stosunku do tej wartości.

Wartości zbierane za pomocą tych kluczy są prawdopodobnie mniej zaszumione niż wartości zbierane przy użyciu bardziej szczegółowych kluczy.

Przykład

Jeśli wszystkie inne ustawienia są takie same, klucz śledzący wartość zakupu globalnie (zsumowaną ze wszystkich krajów) prowadzi do wyższej łącznej wartości zakupu (i wyższej łącznej liczby konwersji) niż klucz śledzący konwersje na poziomie kraju.

W związku z tym szum dotyczący łącznej wartości zakupu w danym kraju będzie wyższy niż szum względny dotyczący łącznej wartości zakupu we wszystkich krajach.

I podobnie, jeśli pozostałe ustawienia są takie same, łączna wartość zakupu butów jest niższa od łącznej wartości zakupu wszystkich produktów (w tym butów).

W związku z tym szum względny dotyczący łącznej wartości zakupu butów będzie wyższy niż szum względny w łącznej wartości zakupu wszystkich produktów.

Wpływ szumu w przypadku klawiszy szczegółowych i przybliżonych.

Podsumowywanie wartości podsumowania (pełnych danych) również sumuje szum z ich wartości

Sumując wartości podsumowujące z raportów podsumowujących w celu uzyskania dostępu do danych wyższego poziomu, sumujesz też szum z tych wartości zbiorczych.

Stopień szumu przy szczegółowych kluczach z podsumowaniem w porównaniu z klawiszami przybliżonymi bez podsumowań

Przyjrzyjmy się 2 różnym podejściom: – Metoda A: uwzględniasz w kluczach identyfikatory geograficzne. W raportach podsumowujących dostępne są klucze na poziomie identyfikatora geograficznego, powiązane z podsumowaną wartością zakupu na poziomie określonego identyfikatora geograficznego. – Metoda B: nie podawaj w kluczach identyfikatora geograficznego. Raporty podsumowujące bezpośrednio pokazują łączną wartość zakupu dla wszystkich identyfikatorów geograficznych lub lokalizacji.

Aby uzyskać dostęp do wartości zakupu na poziomie kraju: – W przypadku metody A sumujesz wartości podsumowujące na poziomie identyfikatora geograficznego, a tym samym także szum z ich wartości. Może to spowodować dodanie większej ilości szumu do ostatecznej wartości zakupu na poziomie identyfikatora geograficznego. – W przypadku metody B patrzymy bezpośrednio na dane udostępniane w raportach podsumowujących. Szum został dodany do tych danych tylko raz.

W związku z tym łączna wartość zakupu w przypadku danego identyfikatora geograficznego może być bardziej zaszumiona przy zastosowaniu metody A.

Podobnie uwzględnienie w kluczach wymiaru na poziomie kodu pocztowego prawdopodobnie zwiększy poziom zaszumiania wyników niż użycie bardziej precyzyjnych kluczy w przypadku wymiaru na poziomie regionu.

Agregacja w dłuższym okresie zwiększa stosunek sygnału do szumu

Wysyłanie żądań raportów podsumowujących oznacza, że każda wartość podsumowania będzie prawdopodobnie wyższa niż w przypadku częstszego wysyłania żądań raportów – w dłuższym okresie konwersji można uzyskać więcej konwersji.

Jak już wspomnieliśmy, im wyższa wartość podsumowania, tym niższy będzie szum względny. Dlatego rzadsze wysyłanie żądań raportów podsumowujących powoduje wyższy (lepszy) stosunek sygnału do szumu.

Rzadsze wysyłanie żądań raportów podsumowujących prowadzi do wyższego stosunku sygnałów do szumu

Oto przykład:

  • Jeśli chcesz uzyskać godzinowe raporty z podsumowaniem obejmującym ponad 24 godziny, a potem zsumować wartość podsumowania z każdego raportu godzinowego, aby uzyskać dostęp do danych na poziomie dnia, szum jest dodawany 24 razy.
  • W jednym dziennym raporcie podsumowującym szum jest dodawany tylko raz.

Wyższy epsilon, niższy szum

Im wyższa wartość epsilonu, tym niższy poziom szumu i niższa ochrona prywatności.

Wykorzystanie filtrowania i usuwania duplikatów

Ważnym elementem rozdzielania budżetu między różne klucze jest określenie, ile razy dane zdarzenie może wystąpić. Na przykład reklamodawcy może zależy tylko na jednym zakupie na każde kliknięcie, ale maksymalnie na 3 konwersje typu „wyświetlenie strony produktu”. Możesz też skorzystać z poniższych funkcji interfejsu API, które pozwolą Ci kontrolować liczbę generowanych raportów i liczbę konwersji, które mają być liczone:

Eksperymenty z epsilonem

Technologie reklamowe mogą ustawić epsilon na wartość większą od 0, ale nie większą niż 64. Ten zakres umożliwia elastyczne testowanie. Niższe wartości parametru epsilon zapewniają lepszą ochronę prywatności. Zalecamy zacząć od epsilon=10.

Zalecenia dotyczące eksperymentów

Zalecamy użycie tej metody: – Zacznij od epsilon = 10. – Jeśli powoduje to poważne problemy z przydatnością, stopniowo zwiększaj epsilon. – Podziel się opinią na temat konkretnych punktów zmiany, które możesz zauważyć w kwestiach związanych z użytecznością danych.

Angażuj i dziel się opiniami

Możesz uczestniczyć w korzystaniu z tego interfejsu API i eksperymentować z nim.

Dalsze kroki