Diese Seite wurde von der Cloud Translation API übersetzt.

NoiseLab

Informationen zu diesem Dokument

In diesem Artikel erfahren Sie:

Hier erfahren Sie, welche Strategien zu erstellen sind, bevor Sie Zusammenfassungsberichte erstellen.
Sie lernen Noise Lab kennen, ein Tool, mit dem Sie die Auswirkungen verschiedener Rauschparameter verstehen und verschiedene Strategien zur Rauschbekämpfung schnell untersuchen und bewerten können.

Feedback geben

In diesem Dokument werden einige Prinzipien für die Verwendung von Zusammenfassungsberichten zusammengefasst. Es gibt jedoch mehrere Ansätze für das Rauschmanagement, die hier möglicherweise nicht berücksichtigt werden. Wir freuen uns über Ihre Vorschläge, Ergänzungen und Fragen.

Wenn Sie öffentlich Feedback zu Strategien zur Geräuschunterdrückung, zur Nützlichkeit oder zum Datenschutz der API (Epsilon) geben und Ihre Beobachtungen zur Simulation mit Noise Lab teilen möchten: Kommentar zu diesem Problem
Wenn Sie öffentlich Feedback zu Noise Lab geben möchten (Frage stellen, Fehler melden oder Funktion anfordern): Hier können Sie ein neues Problem erstellen.
Wenn Sie öffentlich Feedback zu einem anderen Aspekt der API geben möchten, können Sie hier ein neues Problem erstellen.

Vorbereitung

Eine Einführung finden Sie unter Attributionsberichte: Zusammenfassungsberichte und Attributionsberichte – vollständige Systemübersicht.
Sehen Sie sich Informationen zu Rauschen und Aggregationsschlüssel an, um diesen Leitfaden optimal zu nutzen.

Designentscheidungen

Designprinzip

Zwischen der Funktionsweise von Drittanbieter-Cookies und den Zusammenfassungsberichten gibt es grundlegende Unterschiede. Ein wesentlicher Unterschied ist das Rauschen, das den Messdaten in Zusammenfassungsberichten hinzugefügt wird. Eine weitere Möglichkeit ist die Planung von Berichten.

Für den Zugriff auf zusammenfassende Messdaten aus Berichten mit höheren Signal-Rausch-Verhältnissen müssen Demand-Side-Plattformen (DSPs) und Anbieter von Anzeigenmessungen mit ihren Werbetreibenden zusammenarbeiten, um Strategien zur Rauschunterdrückung zu entwickeln. Für die Entwicklung dieser Strategien müssen DSPs und Messanbieter Designentscheidungen treffen. Diese Entscheidungen drehen sich um ein wesentliches Konzept:

Die Rauschwerte für die Verteilung basieren zwar auf zwei Parametern – Epsilon und dem Beitragsbudget – Ihnen stehen weitere Einstellungen zur Verfügung, die sich auf das Signal-Rausch-Verhältnis der ausgegebenen Messdaten auswirken.

Wir gehen davon aus, dass ein iterativer Prozess zu den besten Entscheidungen führt, aber jede Variation dieser Entscheidungen führt zu einer etwas anderen Implementierung. Daher müssen diese Entscheidungen vor jeder Codeiteration und vor der Anzeigenauslieferung getroffen werden.

Entscheidung: Detaillierungsgrad von Dimensionen

In Noise Lab ausprobieren

Wechseln Sie in den erweiterten Modus.
Suchen Sie in der Seitenleiste „Parameter“ nach „Meine Conversion-Daten“.
Beachten Sie die Standardparameter. Standardmäßig beträgt die TOTAL pro Tag zuzuordnende Conversion-Anzahl 1.000. Dies liegt bei etwa 40 pro Bucket, wenn Sie die Standardeinrichtung verwenden (Standarddimensionen, Standardanzahl möglicher unterschiedlicher Werte für jede Dimension, Schlüsselstrategie A). In der Eingabe für die durchschnittliche täglich zuordenbare Conversion-Anzahl PRO BUCKET ist der Wert 40.
Klicken Sie auf Simulieren , um eine Simulation mit den Standardparametern auszuführen.
Suchen Sie in der Seitenleiste „Parameter“ nach „Dimensionen“. Benennen Sie Geography (Region) in City (Stadt) um und ändern Sie die Anzahl der möglichen unterschiedlichen Werte in 50.
Sie sehen, wie sich dadurch die durchschnittliche Anzahl der täglich zuordenbaren Conversions PRO BUCKET ändert. Sie ist jetzt viel niedriger. Das liegt daran, dass, wenn Sie die Anzahl der möglichen Werte innerhalb dieser Dimension ohne weitere Änderungen erhöhen, die Gesamtzahl der Buckets erhöht wird, ohne dass sich die Anzahl der Conversion-Ereignisse in den einzelnen Buckets ändert.
Klicken Sie auf „Simulieren“.
Beachten Sie die Rauschverhältnisse der resultierenden Simulation: Die Rauschverhältnisse sind jetzt höher als in der vorherigen Simulation.

Angesichts des grundlegenden Designprinzips sind kleine Zusammenfassungswerte wahrscheinlich häufiger ungenauer als große Zusammenfassungswerte. Ihre Konfigurationsauswahl wirkt sich daher darauf aus, wie viele zugeordnete Conversion-Ereignisse in die einzelnen Buckets landen (auch als Aggregationsschlüssel bezeichnet) und diese Menge wirkt sich auf das Rauschen in den endgültigen zusammenfassenden Berichten aus.

Eine Designentscheidung, die sich auf die Anzahl der zugeordneten Conversion-Ereignisse in einem einzelnen Bucket auswirkt, ist der Detaillierungsgrad der Dimensionen. Sehen Sie sich die folgenden Beispiele für Aggregationsschlüssel und ihre Dimensionen an:

Ansatz 1: eine Schlüsselstruktur mit groben Dimensionen: Land x Werbekampagne (oder der größte Kampagnenaggregations-Bucket) x Produkttyp (von 10 möglichen Produkttypen)
Methode 2: eine Schlüsselstruktur mit detaillierten Dimensionen: Ort x Creative-ID x Produkt (von 100 möglichen Produkten)

Ort ist eine detailliertere Dimension als Land, Creative-ID ist detaillierter als Kampagne und Produkt detaillierter als Produkttyp. Daher enthält Methode 2 in der Ausgabe des zusammenfassenden Berichts eine geringere Anzahl von Ereignissen (Conversions) pro Bucket (= pro Schlüssel) als Methode 1. Da das in die Ausgabe aufgenommene Rauschen von der Anzahl der Ereignisse im Bucket unabhängig ist, werden die Messdaten in Zusammenfassungsberichten bei Ansatz 2 stärker verwirrend sein. Experimentieren Sie für jeden Werbetreibenden mit verschiedenen Vor- und Nachteilen beim Design des Schlüssels, um einen maximalen Nutzen aus den Ergebnissen zu ziehen.

Entscheidung: Schlüsselstrukturen

In Noise Lab ausprobieren

Im einfachen Modus wird die Standardschlüsselstruktur verwendet. Im erweiterten Modus können Sie mit verschiedenen Schlüsselstrukturen experimentieren. Einige Beispieldimensionen sind enthalten, die Sie auch ändern können.

Wechseln Sie in den erweiterten Modus.
Suchen Sie in der Seitenleiste „Parameter“ nach „Schlüsselstrategie“. Die Standardstrategie, im Tool „A“, verwendet eine detaillierte Schlüsselstruktur, die alle Dimensionen umfasst: Geografie x Kampagnen-ID x Produktkategorie.
Klicken Sie auf „Simulieren“.
Sehen Sie sich die Rauschverhältnisse der resultierenden Simulationen an.
Ändere die Schlüsselstrategie in B. Dadurch werden zusätzliche Steuerelemente zum Konfigurieren der Schlüsselstruktur angezeigt.
Konfigurieren Sie die Schlüsselstruktur. Beispiel:
1. Anzahl der Schlüsselstrukturen: 2
2. Schlüsselstruktur 1 = Geografie x Produktkategorie.
3. Schlüsselstruktur 2 = Kampagnen-ID x Produktkategorie.
Klicken Sie auf „Simulieren“.
Beachten Sie, dass Sie jetzt zwei zusammenfassende Berichte pro Typ von Analyseziel (zwei für die Anzahl der Käufe und zwei für den Kaufwert) erhalten, da Sie zwei unterschiedliche Schlüsselstrukturen verwenden. Beobachten Sie deren Rauschverhältnis.
Sie können dies aber auch mit Ihren eigenen benutzerdefinierten Dimensionen ausprobieren. Suchen Sie dazu nach Daten, die Sie verfolgen möchten: Dimensionen. Sie können die Beispieldimensionen entfernen und mithilfe der Schaltflächen „Hinzufügen/Entfernen/Zurücksetzen“ unter der letzten Dimension eine eigene erstellen.

Eine weitere Designentscheidung, die sich auf die Anzahl der zugeordneten Conversion-Ereignisse in einem einzelnen Bucket auswirkt, sind die von Ihnen zu verwendenden Schlüsselstrukturen. Sehen Sie sich die folgenden Beispiele für Aggregationsschlüssel an:

Eine Schlüsselstruktur mit allen Dimensionen. Diese Strategie bezeichnen wir als A.
Zwei wichtige Strukturen mit jeweils einer Teilmenge von Dimensionen. Wir nennen diese Strategie B.

Strategie A ist einfacher – möglicherweise müssen Sie jedoch die verrauschten Zusammenfassungswerte einschließlich Zusammenfassungsberichten zusammenfassen (Summe), um auf bestimmte Erkenntnisse zugreifen zu können. Indem Sie diese Werte summieren, summieren Sie auch das Rauschen. Bei Strategie B liefern die in den zusammenfassenden Berichten enthaltenen Zusammenfassungswerte bereits die benötigten Informationen. Das bedeutet, dass Strategie B wahrscheinlich zu besseren Signal-Rausch-Verhältnissen führt als Strategie A. Allerdings kann dieses Rauschen bei Strategie A bereits akzeptabel sein, sodass Sie der Einfachheit halber Strategie A bevorzugen. Weitere Informationen finden Sie im detaillierten Beispiel zu diesen beiden Strategien.

Die Schlüsselverwaltung ist ein tiefgreifendes Thema. Es können verschiedene ausgefeilte Techniken in Betracht gezogen werden, um das Signal-Rausch-Verhältnis zu verbessern. Eine wird unter Erweiterte Schlüsselverwaltung beschrieben.

Entscheidung: Batch-Häufigkeit

In Noise Lab ausprobieren

Wechseln Sie in den einfachen Modus oder in den erweiterten Modus. Beide Modi funktionieren bei der Batch-Häufigkeit gleich.
Suchen Sie in der Seitenleiste „Parameter“ nach „Meine Aggregationsstrategie“ > „Batching-Häufigkeit“. Dies bezieht sich auf die Batch-Häufigkeit der aggregierten Berichte, die mit dem Aggregationsdienst in einem einzelnen Job verarbeitet werden.
Beachten Sie die standardmäßige Batching-Häufigkeit: Standardmäßig wird eine tägliche Batching-Häufigkeit simuliert.
Klicken Sie auf „Simulieren“.
Sehen Sie sich die Rauschverhältnisse der resultierenden Simulationen an.
Ändern Sie die Batching-Häufigkeit in wöchentlich.
Sehen Sie sich die Rauschverhältnisse der resultierenden Simulationen an: Die Rauschverhältnisse sind jetzt niedriger (besser) als in der vorherigen Simulation.

Eine weitere Designentscheidung, die sich auf die Anzahl der zugeordneten Conversion-Ereignisse in einem einzelnen Bucket auswirkt, ist die Batch-Häufigkeit, die Sie verwenden möchten. Die Batching-Häufigkeit gibt an, wie oft Sie aggregierbare Berichte verarbeiten.

Ein Bericht, dessen Aggregation häufiger geplant ist (z.B. jede Stunde), enthält weniger Conversion-Ereignisse als derselbe Bericht mit einem selteneren Aggregationsplan (z.B. jede Woche). Daher enthält der stündliche Bericht mehr Datenrauschen.Es sind weniger Conversion-Ereignisse enthalten als im selben Bericht mit einem selteneren Aggregationsplan (z.B. jede Woche). Daher hat der stündliche Bericht bei ansonsten gleichen Bedingungen ein niedrigeres Signal-Rausch-Verhältnis als der wöchentliche Bericht. Experimentieren Sie mit den Berichtsanforderungen bei verschiedenen Frequenzen und bewerten Sie jeweils das Signal-Rausch-Verhältnis.

Weitere Informationen finden Sie unter Batch-Verarbeitung und Aggregation über längere Zeiträume hinweg.

Entscheidung: Kampagnenvariablen, die sich auf zuordenbare Conversions auswirken

In Noise Lab ausprobieren

Dies kann schwierig vorherzusagen sein und neben saisonalen Effekten auch erhebliche Schwankungen haben. Versuchen Sie jedoch, die Anzahl der täglichen Conversions, die einer Single zuordenbar sind, auf eine höchste Potenz von 10 zu schätzen: 10, 100, 1.000 oder 10.000.

Wechseln Sie in den erweiterten Modus.
Suchen Sie in der Seitenleiste „Parameter“ nach „Meine Conversion-Daten“.
Beachten Sie die Standardparameter. Standardmäßig beträgt die TOTAL pro Tag zuzuordnende Conversion-Anzahl 1.000. Dies liegt bei etwa 40 pro Bucket, wenn Sie die Standardeinrichtung verwenden (Standarddimensionen, Standardanzahl möglicher unterschiedlicher Werte für jede Dimension, Schlüsselstrategie A). In der Eingabe für die durchschnittliche täglich zuordenbare Conversion-Anzahl PRO BUCKET ist der Wert 40.
Klicken Sie auf Simulieren , um eine Simulation mit den Standardparametern auszuführen.
Sehen Sie sich die Rauschverhältnisse der resultierenden Simulationen an.
Setzen Sie nun die GESAMTE täglich zuordenbare Conversion-Anzahl auf 100. Beachten Sie, dass dadurch der Wert der durchschnittlichen täglich zuordenbaren Conversion-Anzahl PRO BUCKET gesenkt wird.
Klicken Sie auf „Simulieren“.
Die Rauschverhältnisse sind jetzt höher: Das liegt daran, dass bei weniger Conversions pro Bucket mehr Rauschen angewendet wird, um den Datenschutz zu wahren.

Ein wichtiger Unterschied ist die Gesamtzahl der möglichen Conversions für einen Werbetreibenden im Vergleich zur Gesamtzahl der möglichen zugewiesenen Conversions. Letzteres wirkt sich letztendlich auf das Rauschen in Zusammenfassungsberichten aus. Zugeordnete Conversions sind eine Teilmenge der Conversions insgesamt, für die Kampagnenvariablen wie Anzeigenbudget und Anzeigenausrichtung anfällig sind. So sind Sie beispielsweise bei einer Werbekampagne mit 10 Millionen € mehr zugeordnete Conversions als bei einer Werbekampagne von 10. 000 € zu erwarten – bei ansonsten gleichen Bedingungen.

Beachten Sie Folgendes:

Bewerten Sie die zugeordneten Conversions anhand des Single-Touch-Attributionsmodells desselben Geräts, da diese in den Zusammenfassungsberichten enthalten sind, die mit der Attribution Reporting API erfasst werden.
Berücksichtigen Sie sowohl eine Anzahl für das Worst-Case-Szenario als auch eine Anzahl für das Best-Case-Szenario für zugeordnete Conversions. Wenn alles andere gleich ist, sollten Sie beispielsweise die minimalen und maximal möglichen Kampagnenbudgets für einen Werbetreibenden berücksichtigen und dann die zuordenbaren Conversions für beide Ergebnisse als Eingaben in Ihre Simulation prognostizieren.
Wenn Sie die Verwendung der Android Privacy Sandbox in Betracht ziehen, sollten Sie bei der Berechnung plattformübergreifende zugeordnete Conversions berücksichtigen.

Entscheidung: Skalierung verwenden

In Noise Lab ausprobieren

Wechseln Sie in den erweiterten Modus.
Suchen Sie in der Seitenleiste „Parameter“ nach „Ihre Aggregationsstrategie“ > „Skalierung“. Die Standardeinstellung ist „Ja“.
Um die positiven Auswirkungen der Skalierung auf das Rauschverhältnis zu verstehen, setzen Sie „Skalierung“ zuerst auf „Nein“.
Klicken Sie auf „Simulieren“.
Sehen Sie sich die Rauschverhältnisse der resultierenden Simulationen an.
Setzen Sie „Skalierung“ auf „Ja“. Noise Lab berechnet automatisch die zu verwendenden Skalierungsfaktoren anhand der Bereiche (Durchschnitts- und Höchstwerte) der Messziele für Ihr Szenario. In einer echten System- oder Ursprungstesteinrichtung sollten Sie Ihre eigene Berechnung für Skalierungsfaktoren implementieren.
Klicken Sie auf „Simulieren“.
Beachten Sie, dass die Rauschverhältnisse in dieser zweiten Simulation jetzt niedriger (besser) sind. Das liegt daran, dass Sie Skalierung verwenden.

Angesichts des grundlegenden Designprinzips ist das hinzugefügte Rauschen eine Funktion des Beitragsbudgets.

Wenn Sie die Signal-Rausch-Verhältnisse erhöhen möchten, können Sie die während eines Conversion-Ereignisses erfassten Werte umwandeln, indem Sie sie entsprechend dem Beitragsbudget skalieren (und nach der Aggregation wieder skaliert werden). Verwenden Sie Skalierung, um das Signal-Rausch-Verhältnis zu erhöhen.

Entscheidung: Anzahl der Analyseziele und Aufteilung des Datenschutzbudgets

Dies bezieht sich auf die Skalierung. Lesen Sie daher unbedingt den Abschnitt Skalierung verwenden.

In Noise Lab ausprobieren

Ein Messziel ist ein eindeutiger Datenpunkt, der in Conversion-Ereignissen erfasst wird.

Wechseln Sie in den erweiterten Modus.
Suchen Sie in der Seitenleiste „Parameter“ nach den Daten, die Sie erfassen möchten: Zielvorhaben der Messung. Standardmäßig gibt es zwei Analyseziele: den Kaufwert und die Anzahl der Käufe.
Klicken Sie auf Simulieren , um eine Simulation mit den Standardzielen auszuführen.
Klicken Sie auf „Entfernen“. Dadurch wird das letzte Messziel (in diesem Fall die Anzahl der Käufe) entfernt.
Klicken Sie auf „Simulieren“.
Beachten Sie, dass die Rauschverhältnisse für den Kaufwert jetzt für diese zweite Simulation niedriger (besser) sind. Das liegt daran, dass Sie weniger Messziele haben, sodass Ihr einziges Messziel jetzt das gesamte Beitragsbudget erhält.
Klicken Sie auf Zurücksetzen. Jetzt haben Sie wieder zwei Analyseziele: „Kaufwert“ und „Kaufanzahl“. Noise Lab berechnet automatisch die zu verwendenden Skalierungsfaktoren anhand der Bereiche (Durchschnitts- und Maximalwerte) der Messziele für Ihr Szenario. Standardmäßig wird das Budget von Noise Lab gleichmäßig auf die Messziele aufgeteilt.
Klicken Sie auf „Simulieren“.
Sehen Sie sich die Rauschverhältnisse der resultierenden Simulationen an. Beachten Sie die in der Simulation angezeigten Skalierungsfaktoren.
Passen wir nun die Aufteilung des Datenschutzbudgets an, um ein besseres Signal-Rausch-Verhältnis zu erzielen.
Passen Sie das Budget (%) für jedes Messziel an. Angesichts der Standardparameter hat Messziel 1, also der Kaufwert, einen viel größeren Bereich (zwischen 0 und 1.000) als Messwertziel 2, nämlich die Anzahl der Käufe (zwischen 1 und 1, also immer gleich 1). Daher ist „mehr Platz für die Skalierung“ erforderlich: Es wäre ideal, dem Messziel 1 ein höheres Beitragsbudget zuzuweisen als dem Zielvorhaben 2, damit es effizienter hochskaliert werden kann (siehe „Skalierung“).
Weisen Sie dem Zielvorhaben 1 70% des Budgets zu. Weisen Sie dem Analyseziel 2 30% zu.
Klicken Sie auf „Simulieren“.
Sehen Sie sich die Rauschverhältnisse der resultierenden Simulationen an. Beim Kaufwert sind die Rauschverhältnisse jetzt deutlich niedriger (besser) als in der vorherigen Simulation. Die Anzahl der Käufe bleibt weitgehend unverändert.
Optimieren Sie die Budgetaufteilung zwischen den Messwerten. Beobachten Sie, wie sich das auf das Rauschen auswirkt.

Über die Schaltflächen „Hinzufügen“, „Entfernen“ und „Zurücksetzen“ können Sie eigene benutzerdefinierte Analyseziele festlegen.

Wenn Sie einen Datenpunkt (Messziel) für ein Conversion-Ereignis messen, z. B. die Conversion-Anzahl, kann dieser Datenpunkt das gesamte Beitragsbudget (65536) abrufen. Wenn Sie für ein Conversion-Ereignis mehrere Messziele festlegen, z. B. die Conversion-Anzahl und den Kaufwert, müssen diese Datenpunkte das Beitragsbudget teilen. Dies bedeutet, dass Sie weniger Spielraum haben, um Ihre Werte zu vergrößern.

Daher gilt: Je mehr Messziele Sie haben, desto geringer ist wahrscheinlich das Signal-Rausch-Verhältnis (höheres Rauschen).

Eine weitere Entscheidung, die Sie hinsichtlich der Messziele treffen sollten, ist die Budgetaufteilung. Wenn Sie das Beitragsbudget gleichmäßig auf zwei Datenpunkte aufteilen, erhält jeder Datenpunkt ein Budget von 65.536 ÷ 2 = 32.768. Je nach maximal möglichem Wert für jeden Datenpunkt ist dies möglicherweise nicht optimal. Wenn Sie beispielsweise die Anzahl der Käufe mit einem Höchstwert von 1 und einem Kaufwert mit einem Minimum von 1 und einem Höchstwert von 120 messen, würde der Kaufwert profitieren, wenn Sie „mehr Platz“ zur Skalierung haben, d. h. einen größeren Anteil des Beitragsbudgets erhalten. Sie sehen, ob einige Messziele in Bezug auf die Auswirkungen von Rauschen gegenüber anderen priorisiert werden sollten.

Entscheidung: Ausreißerverwaltung

In Noise Lab ausprobieren

Ein Messziel ist ein eindeutiger Datenpunkt, der in Conversion-Ereignissen erfasst wird.

Wechseln Sie in den erweiterten Modus.
Suchen Sie in der Seitenleiste „Parameter“ nach „Ihre Aggregationsstrategie“ > „Skalierung“.
Achten Sie darauf, dass Skalierung auf Ja eingestellt ist. Noise Lab berechnet automatisch die zu verwendenden Skalierungsfaktoren anhand der Bereiche (Durchschnitts- und Maximalwerte), die Sie für die Messziele angegeben haben.
Angenommen, der bisher größte Kauf erfolgte bei 2.000 $, die meisten Käufe finden jedoch im Bereich zwischen 10 $und 120 $ statt. Sehen wir uns zuerst an, was passiert, wenn wir einen literalen Skalierungsansatz verwenden (nicht empfohlen): Geben Sie für „purchaseValue“ 2.000 $als Maximalwert ein.
Klicken Sie auf „Simulieren“.
Achten Sie darauf, dass die Rauschverhältnisse hoch sind. Das liegt daran, dass unser Skalierungsfaktor derzeit mit 2.000 $berechnet wird, obwohl die meisten Kaufwerte in Wirklichkeit deutlich niedriger sein werden.
Wenden wir nun einen pragmatischen Skalierungsansatz an. Ändern Sie den maximalen Kaufwert in 120 $.
Klicken Sie auf „Simulieren“.
Beachten Sie, dass die Rauschverhältnisse in dieser zweiten Simulation niedriger (besser) sind.

Zur Implementierung der Skalierung wird normalerweise ein Skalierungsfaktor basierend auf dem maximal möglichen Wert für ein bestimmtes Conversion-Ereignis berechnet (weitere Informationen in diesem Beispiel).

Vermeiden Sie jedoch, einen literalen Maximalwert zur Berechnung dieses Skalierungsfaktors zu verwenden, da dies Ihr Signal-Rausch-Verhältnis verschlechtern würde. Entfernen Sie stattdessen Ausreißer und verwenden Sie einen pragmatischen Maximalwert.

Das Ausreißermanagement ist ein tiefgreifendes Thema. Es können verschiedene ausgefeilte Techniken in Betracht gezogen werden, um das Signal-Rausch-Verhältnis zu verbessern. Eine solche wird unter Erweiterte Ausreißerverwaltung beschrieben.

Nächste Schritte

Nachdem Sie verschiedene Strategien zur Rauschunterdrückung für Ihren Anwendungsfall geprüft haben, können Sie mit Zusammenfassungsberichten experimentieren. Dazu erfassen Sie mithilfe eines Ursprungstests echte Messdaten. Lesen Sie Leitfäden und Tipps zum Testen der API.

Anhang

Kurze Einführung in Noise Lab

Mit Noise Lab können Sie Strategien zur Rauschunterdrückung schnell bewerten und vergleichen. Sie können damit:

Machen Sie sich mit den wichtigsten Parametern, die das Rauschen beeinflussen können, und ihrer Wirkung vertraut.
Simulieren Sie die Auswirkungen von Rauschen auf die Ausgabemessdaten anhand verschiedener Designentscheidungen. Optimieren Sie die Designparameter, bis Sie ein Signal-Rausch-Verhältnis erreichen, das für Ihren Anwendungsfall geeignet ist.
Teilen Sie uns Ihr Feedback zum Nutzen der zusammenfassenden Berichte mit: Welche Werte der Epsilon- und Rauschparameter eignen sich für Sie, welche nicht? Wo sind die Wendepunkte?

Betrachten Sie dies als Vorbereitungsschritt. Noise Lab generiert Messdaten, um auf der Grundlage Ihrer Eingabe zusammenfassende Berichte zu simulieren. Es bleiben keine Daten erhalten und es werden auch keine Daten weitergegeben.

In Noise Lab gibt es zwei verschiedene Modi:

Einfacher Modus: Machen Sie sich mit den Grundlagen der Geräuschunterdrückung vertraut.
Erweiterter Modus: Testen Sie verschiedene Strategien zur Rauschunterdrückung und finden Sie heraus, welche für Ihre Anwendungsfälle das beste Signal-Rausch-Verhältnis erzielt.

Klicken Sie im Menü oben auf die Schaltflächen, um zwischen den beiden Modi zu wechseln (siehe Screenshot 1 unten).

Einfacher Modus

Im einfachen Modus steuern Sie Parameter (zu finden auf der linken Seite oder Nr. 2. im Screenshot unten) wie Epsilon und sehen, wie sie das Rauschen beeinflussen.
Für jeden Parameter gibt es eine Kurzinfo (die Schaltfläche „?“). Klicken Sie auf diese Schaltflächen, um eine Erläuterung der einzelnen Parameter zu sehen (siehe Screenshot 3.).
Klicken Sie zuerst auf die Schaltfläche „Simulate“ (Simulieren) und sehen Sie sich an, wie die Ausgabe aussieht (siehe Screenshot 4. unten).
Im Bereich „Ausgabe“ werden verschiedene Details angezeigt. Neben einigen Elementen steht ein „?“. Nehmen Sie sich die Zeit, auf jedes „?“ zu klicken, um eine Erklärung zu den verschiedenen Informationen zu erhalten.
Klicken Sie im Abschnitt „Ausgabe“ auf die Ein/Aus-Schaltfläche „Details“, wenn Sie eine erweiterte Version der Tabelle sehen möchten (Nr. 5. im Screenshot unten).
Unter jeder Datentabelle im Ausgabeabschnitt befindet sich eine Option zum Herunterladen der Tabelle zur Offlinenutzung. Außerdem finden Sie rechts unten eine Option zum Herunterladen aller Datentabellen (Nr. 6 im Screenshot unten).
Testen Sie im Bereich „Parameter“ verschiedene Einstellungen für die Parameter und klicken Sie auf „Simulieren“, um zu sehen, wie sie sich auf die Ausgabe auswirken:

Noise Lab-Oberfläche für einfachen Modus.

Erweiterter Modus

Im erweiterten Modus haben Sie mehr Kontrolle über die Parameter. Sie können benutzerdefinierte Messziele und Dimensionen hinzufügen (siehe 1. und 2. im Screenshot unten).
Scrolle im Abschnitt „Parameter“ weiter nach unten und sieh dir die Option „Schlüsselstrategie“ an. Damit lassen sich verschiedene wichtige Strukturen testen (siehe 3. im Screenshot unten).
- Ändere die Schlüsselstrategie auf „B“, um verschiedene Schlüsselstrukturen zu testen
- Geben Sie die Anzahl der verschiedenen Schlüsselstrukturen ein, die Sie verwenden möchten. Der Standardwert ist „2“.
- Klicken Sie auf „Generate Key Structures“ (Schlüsselstrukturen erstellen).
- Wenn Sie die Optionen zum Angeben Ihrer Schlüsselstrukturen sehen möchten, klicken Sie auf die Kästchen neben den Schlüsseln, die Sie für die einzelnen Schlüsselstrukturen einbeziehen möchten
- Klicken Sie auf „Simulieren“, um die Ausgabe zu sehen.
  
  Noise Lab-Oberfläche für erweiterten Modus.
  
  Noise Lab-Oberfläche für erweiterten Modus.

Rauschenmesswerte

Kernkonzept

Es wird Rauschen hinzugefügt, um die Privatsphäre der einzelnen Nutzer zu schützen.

Ein hoher Rauschwert weist darauf hin, dass Buckets/Schlüssel spärlich sind und Beiträge von einer begrenzten Anzahl sensibler Ereignisse enthalten. Dies erfolgt automatisch von Noise Lab, damit sich Personen "in der Menge verstecken" können oder mit anderen Worten die Privatsphäre dieser eingeschränkten Personen durch eine größere Menge an Rauschen geschützt werden.

Ein niedriger Rauschwert weist darauf hin, dass die Dateneinrichtung so konzipiert wurde, dass sich Personen bereits "unter der Menge verstecken" können. Das bedeutet, dass die Buckets Beiträge von einer ausreichenden Anzahl von Ereignissen enthalten, um die Privatsphäre der einzelnen Nutzer zu schützen.

Diese Anweisung gilt sowohl für den durchschnittlichen prozentualen Fehler (Average Percentage Error, APE) als auch für RMSRE_T (Root-Mean-Square relative Fehler mit einem Grenzwert).

APE (durchschnittlicher prozentualer Fehler)

APE ist das Verhältnis des Rauschens über dem Signal, also der tatsächliche zusammenfassende Wert.p> Niedrigere APE-Werte bedeuten ein besseres Signal-Rausch-Verhältnis.

Formel

Für einen gegebenen zusammenfassenden Bericht wird der APE wie folgt berechnet:

Die Gleichung für den APE-Wert. Absolute Werte sind erforderlich, da Rauschen negativ sein kann.

True ist die tatsächliche Zusammenfassung. APE ist der Durchschnitt des Rauschens für jeden echten zusammenfassenden Wert, gemittelt aus allen Einträgen in einem Zusammenfassungsbericht. In Noise Lab wird dieser Wert dann mit 100 multipliziert, um einen Prozentsatz zu erhalten.

Vor- und Nachteile

Eimer mit kleineren Größen haben einen unverhältnismäßigen Einfluss auf den endgültigen Wert von APE. Das könnte bei der Lärmbeurteilung irreführend sein. Aus diesem Grund haben wir einen weiteren Messwert, RMSRE_T, hinzugefügt, um diese Einschränkung von APE abzuschwächen. Weitere Informationen finden Sie in den Beispielen.

Code

Überprüfen Sie den Quellcode für die APE-Berechnung.

RMSRE_T (Root-Mean-Quadrat-Relativer Fehler mit einem Grenzwert)

RMSRE_T (Root-Mean-Quadrat-relative Fehler mit einem Grenzwert) ist ein weiteres Maß für das Rauschen.

RMSRE_T interpretieren

Niedrigere RMSRE_T-Werte bedeuten bessere Signal-Rausch-Verhältnisse.
Wenn ein Rauschverhältnis, das für Ihren Anwendungsfall akzeptabel ist, beispielsweise 20 % und RMSRE_T 0,2 beträgt, können Sie sicher sein, dass die Rauschpegel in den akzeptablen Bereich fallen.

Formel

Für einen gegebenen zusammenfassenden Report wird RMSRE_T wie folgt berechnet:

Vor- und Nachteile

RMSRE_T ist etwas komplexer zu verstehen als APE. Es hat jedoch einige Vorteile, die es in einigen Fällen besser als APE für die Analyse von Rauschen in Zusammenfassungsberichten geeignet machen:

RMSRE_T ist stabiler. „T“ ist ein Grenzwert. „T“ wird verwendet, um Buckets mit weniger Conversions in der RMSRE_T-Berechnung eine geringere Gewichtung zu geben, die aufgrund ihrer geringen Größe daher empfindlicher auf Rauschen reagieren. Mit T steigt der Messwert bei Buckets mit wenigen Conversions nicht an. Wenn T gleich 5 ist, wird ein Rauschwert von nur 1 für einen Bucket mit 0 Conversions nicht als Weg über 1 angezeigt. Stattdessen wird er auf 0, 2 begrenzt, was 1/5 entspricht, da T gleich 5 ist. Da kleinere Buckets, die empfindlicher auf Rauschen reagieren, weniger gewichtet werden, ist dieser Messwert stabiler und erleichtert den Vergleich von zwei Simulationen.
RMSRE_T ermöglicht eine einfache Aggregation. Wenn Sie den RMSRE_T mehrerer Buckets zusammen mit ihren tatsächlichen Zählungen kennen, können Sie den RMSRE_T ihrer Summe berechnen. Auf diese Weise können Sie auch für RMSRE_T für diese kombinierten Werte optimieren.

Obwohl eine Aggregation für APE möglich ist, ist die Formel ziemlich kompliziert, da sie den absoluten Wert der Summe der Laplace-Rauschen beinhaltet. Das erschwert die Optimierung von APE.

Code

Überprüfen Sie den Quellcode für die RMSRE_T-Berechnung.

Beispiele

Zusammenfassungsbericht mit drei Kategorien:

Bucket_1 = Rauschen: 10, trueSummaryValue: 100
Bucket_2 = Rauschen: 20, trueSummaryValue: 100
Bucket_3 = Rauschen: 20, trueSummaryValue: 200

APE = (0,1 + 0,2 + 0,1) / 3 = 13%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,200))^2) / 3) =  sqrt( (0.01 + 0.04 + 0.01) / 3) =  0.14

Zusammenfassungsbericht mit drei Kategorien:

Bucket_1 = Rauschen: 10, trueSummaryValue: 100
Bucket_2 = Rauschen: 20, trueSummaryValue: 100
Bucket_3 = Rauschen: 20, trueSummaryValue: 20

APE = (0,1 + 0,2 + 1) / 3 = 43%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,20))^2) / 3)  =  sqrt( (0.01 + 0.04 + 1.0) / 3) =  0.59

Zusammenfassungsbericht mit drei Kategorien:

Bucket_1 = Rauschen: 10, trueSummaryValue: 100
Bucket_2 = Rauschen: 20, trueSummaryValue: 100
Bucket_3 = Rauschen: 20, trueSummaryValue: 0

APE = (0,1 + 0,2 + unendlich) / 3 = unendlich

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2  +
(20/max(5,0))^2) / 3) =  sqrt( (0.01 + 0.04 + 16.0) / 3) =  2.31

Erweiterte Schlüsselverwaltung

Ein DSP oder ein Unternehmen für Anzeigenmessung kann Tausende von Werbekunden weltweit haben, die sich über verschiedene Branchen, Währungen und das Potenzial von Kaufpreisen erstrecken. Daher ist das Erstellen und Verwalten eines Aggregationsschlüssels pro Werbetreibendem wahrscheinlich nicht sehr praktikabel. Außerdem wird es schwierig sein, einen maximalen zusammengefassten Wert und ein Aggregationsbudget auszuwählen, die die Auswirkungen des Rauschens auf diese Tausenden von Werbetreibenden weltweit begrenzen können. Betrachten wir stattdessen die folgenden Szenarien:

Schlüsselstrategie A

Der Anbieter von Anzeigentechnologien beschließt, einen Schlüssel für alle Werbekunden zu erstellen und zu verwalten. Bei allen Werbetreibenden und in allen Währungen variiert das Spektrum der Käufe von High-End-Käufen mit geringem Volumen bis hin zu Käufen mit hohem Volumen und Low-End-Käufen. Dies führt zu folgendem Schlüssel:

	Schlüssel (mehrere Währungen)
Max. aggregierbarer Wert	5.000.000
Wertebereich für Kauf	[120–5000000]

Kernstrategie B

Der Anzeigentechnologie-Anbieter beschließt, zwei Schlüssel für alle Werbekunden zu erstellen und zu verwalten. Es beschließt, Schlüssel nach Währung zu trennen. Bei allen Werbetreibenden und in allen Währungen variiert das Spektrum an Käufen von Käufen mit geringem Volumen, High-End-Käufen bis hin zu hohen Volumen, Low-End-Käufen. Bei der Trennung nach Währung werden zwei Schlüssel erstellt:

	Schlüssel 1 (USD)	Schlüssel 2 (JPY)
Max. aggregierbarer Wert	40.000 $	5.000.000 Yen
Wertebereich für Kauf	[120–40.000]	[15.000–5.000.000]

Das Ergebnis von Schlüsselstrategie B ist weniger verrauscht als Schlüsselstrategie A, da Währungswerte nicht gleichmäßig über alle Währungen verteilt sind. Betrachten Sie beispielsweise, wie Käufe in US-Dollar und in US-Dollar geführte Käufe in Kombination mit Käufen in Yen die zugrunde liegenden Daten beeinflussen und zu einer verrauschten Ausgabe führen.

Schlüsselstrategie C

Der Anbieter von Anzeigentechnologien beschließt, vier Schlüssel für alle Werbekunden zu erstellen und zu verwalten und nach Währung x Werbetreibenden-Branche zu trennen:

	Schlüssel 1 (USD x Werbetreibende für Luxusschmuck)	Schlüssel 2 (JPY x Werbetreibende für hochwertige Schmuckstücke)	Schlüssel 3 (USD x Werbetreibender für Bekleidung)	Schlüssel 4 (Werbetreibende für Bekleidungseinzelhändler JPY)
Max. aggregierbarer Wert	40.000 $	5.000.000 Yen	500 €	65.000 JPY
Wertebereich für Kauf	[10.000–40.000]	[1.250.000–5.000.000]	[120–500]	[15.000–65.000]

Das Ergebnis von Schlüsselstrategie C wird weniger verrauscht als Strategie B, da die Kaufwerte von Werbetreibenden nicht gleichmäßig auf die Werbetreibenden verteilt sind. Überlegen Sie beispielsweise, wie Käufe von hochwertigem Schmuck in Kombination mit Anschaffungen von Baseballmützen die zugrunde liegenden Daten und das daraus resultierende, ungenaue Ergebnis verändern werden.

Erwägen Sie, gemeinsame maximale zusammengefasste Werte und gemeinsame Skalierungsfaktoren für Gemeinsamkeiten zwischen mehreren Werbetreibenden zu erstellen, um Rauschen in der Ausgabe zu reduzieren. Beispielsweise können Sie verschiedene Strategien für Ihre Werbetreibenden ausprobieren:

Eine Strategie nach Währung getrennt (USD, JP, CAD usw.)
Eine nach Branche der Werbetreibenden (Versicherung, Automobil, Einzelhandel usw.) getrennte Strategie
eine Strategie getrennt nach ähnlichen Kaufwertbereichen ([100], [1000], [10.000] usw.)

Durch die Entwicklung von Schlüsselstrategien im Hinblick auf Gemeinsamkeiten von Werbetreibenden sind Schlüssel und der entsprechende Code einfacher zu verwalten und die Signal-Rausch-Verhältnisse werden höher. Experimentieren Sie mit verschiedenen Strategien mit Gemeinsamkeiten von Werbetreibenden, um Wendepunkte bei der Maximierung der Auswirkungen des Rauschens im Vergleich zur Codeverwaltung zu ermitteln.

Erweiterte Ausreißerverwaltung

Sehen wir uns ein Szenario für zwei Werbetreibende an:

Werbetreibender A:
- Für alle Produkte auf der Website des Werbetreibenden A liegen die Kaufpreismöglichkeiten zwischen [120–1.000 $] und einem Bereich von 880 $.
- Die Kaufpreise werden gleichmäßig über den Bereich von 880 $verteilt und haben keine Ausreißer außerhalb von zwei Standardabweichungen vom Medianwert für den Kaufpreis.
Werbetreibender B:
- Für alle Produkte auf der Website des Werbetreibenden B liegen die Kaufpreismöglichkeiten zwischen [120–1.000 €] und einem Bereich von 880 €.
- Die Kaufpreise liegen stark im Bereich von 120 bis 500 $, wobei nur 5% der Käufe in diesem Bereich liegen.

Angesichts der Anforderungen für das Beitragsbudget und der Methodik, mit der [Rauschen](/privacy-sandbox/relevance/attribution-reporting/understanding-noise/#how-noise-is-applied) auf die Endergebnisse angewendet wird, hat der Werbetreibende B standardmäßig ein lauteres Ergebnis als der Werbetreibende A, da er ein höheres Potenzial für Ausreißer hat, die sich auf die zugrunde liegenden Berechnungen auswirken.

Sie können dieses Problem durch eine bestimmte Schlüsseleinrichtung abmildern. Testen Sie wichtige Strategien, um Ausreißerdaten zu verwalten und Kaufwerte gleichmäßiger über den Kaufbereich des Schlüssels zu verteilen.

Für den Werbetreibenden B könnten Sie zwei separate Schlüssel erstellen, um zwei verschiedene Wertebereiche für Käufe zu erfassen. In diesem Beispiel hat die Anzeigentechnologie-Mitarbeiter festgestellt, dass Ausreißer über dem Kaufwert von 500 $erscheinen. Implementieren Sie für diesen Werbetreibenden zwei separate Schlüssel:

Schlüsselstruktur 1 : Schlüssel, der nur Käufe im Bereich von 120 $bis 500 $ erfasst (die etwa 95% des gesamten Kaufvolumens abdeckt).
Schlüsselstruktur 2: Schlüssel, mit dem nur Käufe über 500 $erfasst werden (die etwa 5% des gesamten Kaufvolumens ausmachen).

Die Implementierung dieser Schlüsselstrategie sollte für den Werbetreibenden B das Rauschen besser bewältigen und ihm den Nutzen aus den zusammenfassenden Berichten maximieren. Angesichts der neuen kleineren Bereiche sollten Schlüssel A und Schlüssel B nun eine gleichmäßigere Verteilung der Daten auf die einzelnen Schlüssel haben als für den vorherigen einzelnen Schlüssel. Dies hat weniger Auswirkungen auf das Rauschen auf die Ausgabe jedes Schlüssels als auf den vorherigen einzelnen Schlüssel.