Referenz zur mathematischen Notation

Dieser Leitfaden dient als Referenz für die in Meridian verwendete mathematische Notation.

Er soll Ihnen dabei helfen, die Gleichungen zur Schätzung der kausalen Wirkung Ihrer Testvariablen zu interpretieren und zu verstehen sowie Budgetoptimierungen vorzunehmen.

Inhaltsverzeichnis


Basisvariablen und Eingabedaten

Diese Symbole stehen für die Eingaben, die in den Modellgleichungen von Meridian verwendet werden. Sie stellen vollständig skalierte und transformierte Daten dar. Der Buchstabe gibt den Messwert an und der hochgestellte Wert in Klammern definiert den spezifischen Datentyp oder die Datenkategorie.

Symbol Beschreibung
$y$ KPI: Die Antwortvariable (Zielvariable, abhängige Variable) des Modells. Das können Umsatz, Verkaufseinheiten, Conversions oder beliebige andere Messwerte sein, auf die die Testvariablen möglicherweise einen kausalen Einfluss haben.
$z^{[C]}$ Kontrollvariablen: Variablen im Modell, die keine Testvariablen sind (z. B. Wetter oder Preis). Sie werden verwendet, um das Baseline-Ergebnis zu schätzen.
$x^{[M]}$ Variablen für bezahlte Media: Die Ebene der Media-Ausführung (z. B. Klicks oder Ausgaben) für bezahlte Media-Channels.
$r^{[RF]}$ Reichweite (bezahlt): Die Anzahl der einzelnen Personen, die durch bezahlte Media erreicht wurden.
$f^{[RF]}$ Häufigkeit (bezahlt): Die Anzahl der bezahlten Impressionen pro einzelner Person.
$x^{[OM]}$ Variablen für organische Media: Die Ebene der Media-Ausführung (z. B. Newsletter-Öffnungen) für organische Media-Channels.
$r^{[ORF]}$ Organische Reichweite: Die Anzahl der einzelnen Personen, die durch organische Media erreicht wurden.
$f^{[ORF]}$ Organische Häufigkeit: Die Anzahl der organischen Impressionen pro einzelner Person.
$x^{[N]}$ Nicht mediabezogene Testvariablen: Die Ausführungsebene für nicht mediabezogene Interventionen (z. B. Werbeaktionen oder Preise).
$p$ Grundgesamtheit: Die Bevölkerungsgröße der einzelnen geografischen Einheiten, die zum Skalieren von Daten verwendet wird, damit kleine und große Regionen verglichen werden können.
$u$ Einheitenwerte: Währungswerte, die verwendet werden, um rohe Einheiten für ROI-Berechnungen in Ausgaben umzurechnen.
  • Eingabedaten: Auf dieser Seite werden die genauen Datenstrukturen und Dimensionsanforderungen für Basisvariablen wie $y$, $z^{[C]}$ und $x^{[M]}$ definiert.
  • Reichweite und Häufigkeit: Hier wird erläutert, wie Reichweite ($r^{[RF]}$) und Häufigkeit ($f^{[RF]}$) Standardmesswerte für die Ausführung ersetzen, um die Sättigung genauer zu modellieren.
  • Variablen für organische Media und nicht mediabezogene Testvariablen: Auf dieser Seite werden die Unterschiede zwischen bezahlten Media, organischen Media ($x^{[OM]}$) und nicht mediabezogenen Testvariablen ($x^{[N]}$) beschrieben, einschließlich Kostenstrukturen und Variablenverhalten.
  • Kontrollvariablen: Hier wird die kausale Begründung für die Auswahl von Störvariablen ($z^{[C]}$) zur Korrektur Ihrer Schätzungen erläutert.

Notation für Datenstatus und -transformation

Im Meridian-Framework durchlaufen Variablen eine Transformationsfunktion, bevor sie in das Modell aufgenommen werden. Sonderzeichen wie Punkte und Kreuze geben an, in welcher Phase der Transformation sich die Daten befinden.

Symbol Beschreibung Beispiel
$\ddot{(\cdot)}$ Rohdaten (zwei Punkte): Die im Ist-Zustand bereitgestellten Daten, bevor eine Skalierung erfolgt. $\ddot{y}$ steht für den KPI-Rohwert einer Region.
$(\cdot)^\dagger$ Grundgesamtheit skaliert (Kreuz): Der Zwischenzustand der Daten. Das sind die Rohdaten geteilt durch die Grundgesamtheit der geografischen Einheit ($p_ {g}$). $y^\dagger_ {g,t} = \ddot{y}_ {g,t} / p_ {g}$
$(\cdot)$ Vollständig transformierte Variable: Die endgültigen transformierten Daten, die in den Modellgleichungen verwendet werden. Für einen KPI ist dies die mit einem Kreuz markierte Variable, die auf den Mittelwert 0 zentriert und auf die Standardabweichung 1 skaliert wird. $y$ ist der endgültige Umsatzwert, aus dem das Modell lernt.
$L(\cdot)$ Transformationsfunktion: Die spezifische lineare Transformationsfunktion, die angewendet wird, um die Rohwerte in vollständig skalierte Einheiten umzuwandeln.

Spezifische Details zu jeder in Meridian durchgeführten Transformation finden Sie im Abschnitt Eingabedaten.
$y = L^{[Y]}(\ddot{y})$
  • Eingabedaten: Hier finden Sie die genauen linearen Skalierungsfunktionen $L(\cdot)$, die auf jeden Variablentyp angewendet werden, um Rohwerte in vollständig skalierte Einheiten umzuwandeln.
  • Modellspezifikation: Hier sehen Sie, wie die vollständig skalierten Variablen letztendlich in der Regressionsgleichung verwendet werden.

Indexvariablen (Subskripte)

Indexe sind die „Koordinaten“ für Datenarrays. Sie geben genau an, auf welchen Datenausschnitt verwiesen wird. Meridian versieht die Basisvariablen mit Subskripten, um Dimensionen wie geografische Einheit und Zeit zu definieren (z. B. $x^{[M]}_ {g,t,i}$).

Symbol Beschreibung Beispiel
$g$ Geografie: Indexiert bestimmte geografische Einheiten ($1, \dots, G$). $g$ = New York oder London.
$t$ Zeit: Indexiert bestimmte Zeiträume ($1, \dots, T$). $t$ = Woche 10 des Zeitraums, der zum Trainieren des MMM verwendet wurde.
$i$ Variablenindex: Ein universeller Index, mit dem ein bestimmter Channel oder eine bestimmte Testvariable innerhalb einer Kategorie angegeben wird. $i = 3$ bezieht sich auf den dritten bezahlten Media-Channel.
$G$ Geografische Einheiten insgesamt: Die Gesamtzahl der geografischen Einheiten. $G = 50$ für ein Modell auf US-Bundesstaatsebene.
$T$ Zeiträume insgesamt: Die Gesamtzahl der Zeiträume. $T = 104$ für zwei Jahre an wöchentlichen Daten.
$N_ {C}$ Kontrollvariablen insgesamt: Die Gesamtzahl der Kontrollvariablen. $N_ {C} = 3$ (z. B. Preis, Wetter, Feiertage).
$N_ {M}$ Bezahlte Media insgesamt: Die Gesamtzahl der Variablen für bezahlte Media ohne Reichweite und Häufigkeit. $N_ {M} = 4$ (z. B. TV, Radio, Print, Suche).
$N_ {RF}$ Bezahlte Reichweite und Häufigkeit insgesamt: Die Gesamtzahl der Variablen für bezahlte Media mit Reichweite und Häufigkeit. $N_ {RF} = 2$ (z. B. Facebook, YouTube).
$N_ {OM}$ Organische Media insgesamt: Die Gesamtzahl der Variablen für organische Media ohne Reichweite und Häufigkeit. $N_ {OM} = 2$ (z. B. SEO, Beiträge in sozialen Medien).
$N_ {ORF}$ Organische Variablen für Reichweite und Häufigkeit insgesamt: Die Gesamtzahl der Variablen für organische Media mit Reichweite und Häufigkeit. $N_ {ORF} = 1$ (z. B. organischer Newsletter).
$N_ {N}$ Nicht mediabezogene Testvariablen insgesamt: Die Gesamtzahl der nicht mediabezogenen Testvariablen. $N_ {N} = 2$ (z. B. Werbeaktionen im Geschäft, Gutscheine).
  • Modellierung auf geografischer Ebene: Hier werden die statistischen Vorteile der Indexierung von Daten nach geografischer Einheit ($g$) im Vergleich zur Aggregation von Daten auf Länderebene erläutert.
  • Holdout-Beobachtungen: Auf dieser Seite erfahren Sie, wie bestimmte Zeit- ($t$) und geografische ($g$) Koordinaten während des Modelltrainings ausgeschlossen werden, um die Anpassungsgüte außerhalb der Stichprobe zu berechnen.
  • Modellierung auf Länderebene: Hier werden die Parametereinschränkungen beschrieben, die Meridian automatisch anwendet, wenn eine einzelne geografische Einheit ($G=1$) modelliert wird.

Modellparameter

Das sind die „gelernten“ Parameter und Koeffizienten (mit griechischen Buchstaben gekennzeichnet), die das Modell aus den Daten schätzt.

Symbol Beschreibung
$\theta$ Theta: Allgemeiner Begriff für alle nicht beobachtbaren Parameter, die vom Modell geschätzt werden.
$\tau_ {g}$ Tau (geografische Achsenabschnitte): Geografische Effekte, die den durchschnittlichen KPI jeder geografischen Einheit im Vergleich zur geografischen Baseline-Einheit darstellen.
$\mu_ {t}$ Mu (zeitvariable Achsenabschnitte): Zeiteffekte, die aus den Knotenwerten abgeleitet werden.
$b_ {k}$ Knotenparameter: Der geschätzte Knotenwert am Knoten $k$.
$\beta^{[M]}_ {i}, \beta^{[RF]}_ {i},$
$\beta^{[OM]}_ {i}, \beta^{[ORF]}_ {i}$
Beta (hierarchische Media-Effekte): Ein Parameter für die hierarchische Verteilung der Media-Effekte auf geografischer Ebene. Wenn die Verteilung der Media-Effekte auf „normal“ festgelegt ist, handelt es sich um den hierarchischen Mittelwert. Ist „log-normal“ festgelegt, ist es der hierarchische Parameter für den Mittelwert der zugrunde liegenden, logarithmisch transformierten Normalverteilung.
$\beta^{[M]}_ {g,i}, \beta^{[RF]}_ {g,i},$
$\beta^{[OM]}_ {g,i}, \beta^{[ORF]}_ {g,i}$
Beta (Media-Effekte auf geografischer Ebene): Der spezifische Media-Effekt-Koeffizient für einen Channel $i$ in der geografischen Einheit $g$, der aus der hierarchischen Verteilung gezogen wird.
$\gamma^{[C]}_ {i}, \gamma^{[N]}_ {i}$ Gamma (hierarchischer Mittelwert der Kontrollvariablen): Der hierarchische Mittelwert des Koeffizienten für eine Kontrollvariable oder einen nicht mediabezogenen Channel. Die Hierarchie wird über geografische Einheiten definiert.
$\sigma$ Sigma (residuale Standardabweichung): Die Standardabweichung des Rauschens.
$\eta$ Eta (hierarchische Media-Varianz): Ein Parameter für die hierarchische Verteilung der Media-Effekte auf geografischer Ebene. Wenn die Verteilung der Media-Effekte auf „normal“ festgelegt ist, handelt es sich um die hierarchische Standardabweichung. Ist „log-normal“ festgelegt, ist sie der hierarchische Parameter für die Standardabweichung der zugrunde liegenden, logarithmisch transformierten Normalverteilung.
$\xi$ Xi (hierarchische Varianz für Kontrollvariablen und nicht mediabezogene Variablen): Die hierarchische Standardabweichung des Koeffizienten für eine Kontrollvariable oder einen nicht mediabezogenen Channel. Die Hierarchie wird über geografische Einheiten definiert.
$\alpha$ Alpha (Adstock-Abklingrate): Ein Wert zwischen 0 und 1.
$\mathtt{ec}$ Halbsättigung: Der Sättigungspunkt, an dem Sie 50 % der maximal möglichen Umsatzsteigerung erzielen.
$\mathtt{slope}$ Steigung: Steuert die Form der Reaktionskurve. Bei $slope\leq1$ wird eine streng konkave Kurve erstellt, bei $slope > 1$ eine S-Kurve.
  • Modellspezifikation: Hier finden Sie die vollständige Regressionsgleichung, aus der hervorgeht, wie nicht beobachtbare Parameter wie $\beta$, $\gamma$ und $\tau$ interagieren, um das Ergebnis zu schätzen.
  • Standard-Prior-Verteilungen: Hier werden die statistischen Standardverteilungen und die Begründung für deren Zuweisung zu gelernten Parametern wie $\tau_g$, $\beta_i$ und $\sigma$ aufgeführt.
  • Bayessche Inferenz: Hier wird erläutert, wie mit dem MCMC-Stichprobenverfahren diese nicht beobachtbaren Parameter ($\theta$) und ihre Unsicherheit anhand der beobachteten Daten gemeinsam geschätzt werden.

Hyperparameter

Dies sind feste Parameter, die vor dem Training des Modells festgelegt werden. Sie dienen als strukturelle Eingaben und nicht als gelernte Koeffizienten.

Symbol Beschreibung
$L$ Maximale Verzögerungsdauer: Ein fester Hyperparameter, der die maximale Anzahl von Wochen angibt, in denen eine Anzeige sich laut Annahme auf den Umsatz auswirkt.
$K$ Knoten insgesamt: Die Gesamtzahl der Knoten, die zur Modellierung des zeitvariablen Zeiteffekts verwendet werden.
$s_ {k}$ Knotenposition: Der spezifische Zeitraum, in dem sich der $k$. Knoten befindet.

Zeitvariable Parameter

In Meridian werden Knoten verwendet, um Zeiteffekte zu modellieren. Anstatt für jeden einzelnen Zeitraum einen eindeutigen Zeiteffekt zu schätzen, werden im Modell Werte an bestimmten Ankerpunkten (Knoten) geschätzt und die Werte für die Zwischenzeiträume interpoliert.

Diese Symbole stehen für die Funktionsweise der Notation, die zur Berechnung dieser Interpolation verwendet wird.

Symbol Beschreibung
$b_ {k}$ Knotenparameter: Der geschätzte Knotenwert am Knoten $k$.
$\ell(t)$ Unterer Knotenindex: Der Index des unmittelbar vorangehenden Knotens für einen bestimmten Zeitpunkt $t$.
$u(t)$ Oberer Knotenindex: Der Index des unmittelbar nachfolgenden Knotens für einen bestimmten Zeitpunkt $t$.
$w(t)$ Zeitgewicht: Das Interpolationsgewicht für den Zeitpunkt $t$, das auf Grundlage des Abstands zwischen den benachbarten Knotenpositionen ($s_ {\ell(t)}$ und $s_ {u(t)}$) berechnet wird.
$\mu_ {t}$ Zeitvariabler Achsenabschnitt: Der resultierende Zeiteffekt für den Zeitpunkt $t$, berechnet als gewichteter Durchschnitt: $\mu_ {t} = w(t)b_ {\ell(t)} + (1-w(t))b_ {u(t)}$.
  • Knoten festlegen: Hier wird beschrieben, wie Sie die Gesamtzahl der Knoten $k$ auswählen und die Abwägung zwischen Bias und Varianz für die Schätzung von Zeiteffekten ausgleichen.
  • Modellspezifikation: Hier wird die genaue distanzbasierte Gewichtsberechnung $w(t)$ beschrieben, die zum Interpolieren von $\mu_t$ zwischen benachbarten Knotenpositionen verwendet wird.

Modellspezifikation

Die vollständige mathematische Gleichung, mit der diese Eingaben und Parameter im Meridian-Modell kombiniert werden, finden Sie auf der Seite Modellspezifikation.

Bedingungen und Logik

Diese Symbole stehen für Abhängigkeiten, mathematische Logik oder statistische Beziehungen.

Symbol Beschreibung Beispiel
$\mid$ Der senkrechte Strich: Wird als „gegeben“ gelesen. Er gibt die bedingte Wahrscheinlichkeit oder den Erwartungswert an. $P(\theta \mid data)$ bedeutet die Wahrscheinlichkeit der Parameter bei den beobachteten Daten.
$I_ {\lbrace \dots \rbrace}$ Indikatorfunktion: Ein logischer Schalter. Sie ist 1, wenn die Bedingung innerhalb der Klammern true ist, andernfalls ist sie 0. $I_ {i}^{[C]} = 1$, wenn die Skalierung der Grundgesamtheit für die Kontrollvariable $i$ verwendet wird, andernfalls 0.
$\sim$ Tilde-Operator: Wird als „ist verteilt nach“ gelesen. Verknüpft einen Parameter mit seiner statistischen Prior-Verteilung. Hinweis: Dieser Operator unterscheidet sich vom Tilde-Akzent $\overset \sim Y$, der zur Kennzeichnung potenzieller Ergebnisse verwendet wird. $\gamma^{[C]}_ {i} \sim \text{Normal}(0, 5)$ bedeutet, dass der Parameter einer Normalverteilung mit Mittelwert 0 und Standardabweichung 5 folgt.
$\lbrace \dots \rbrace$ Geschweifte Klammern: Kennzeichnen eine Menge, einen Vektor oder ein mehrdimensionales Array von Variablen. ${x_ {g,t,i}}$ steht für das gesamte Array der beobachteten Media-Ausführung und ${q_ {t-s}}^L_ {s=0}$ für eine Sequenz über eine Zeitverzögerung.
$\forall$ Für alle: Der universelle Quantor. Das bedeutet, dass die Gleichung oder Bedingung für jeden Wert in einer bestimmten Menge gilt. $\forall g,t$ bedeutet, dass die Bedingung für alle geografischen Regionen und alle Zeiträume gilt.
  • Eingabedaten: Hier wird die Mengennotation (${\dots}$) verwendet, um die vollständigen Arrays der Kontroll- und Testvariablen zu definieren, die für die Modellierung erforderlich sind.
  • Bayessche Inferenz: Hier wird die bedingte Wahrscheinlichkeit $P(\theta \mid data)$ erläutert, die den Kern der MCMC-Stichprobenverfahrens von Meridian bildet.
  • Erforderliche Annahmen: Hier wird die Annahme der bedingten Austauschbarkeit ($E(\overset \sim Y \mid z)$) beschrieben, die für eine sichere Schätzung kausaler Effekte erforderlich ist.

Kausale Inferenz und Budgetoptimierung

Diese Symbole werden verwendet, um kontrafaktische Szenarien zu definieren, Reaktionskurven zu generieren und optimale Budgetzuweisungen zu berechnen.

Symbol Beschreibung
$\overset \sim Y^{(\lbrace x^{(1)} \rbrace)}$ Potenzielles Ergebnis: Das hypothetische Ergebnis (z. B. Umsatz), das in einem bestimmten Szenario eintreten würde. Die Tilde ($\overset \sim Y$) gibt an, dass es sich um ein potenzielles Ergebnis handelt, und der hochgestellte Wert ($\lbrace x^{(1)} \rbrace$) bezeichnet das spezifische Media-Ausführungsszenario, das getestet wird.
$x^{(1)}, x^{(0)}$ Kontrafaktische Szenarien: Werden verwendet, um verschiedene Szenarien der Media-Ausführung zu vergleichen. Normalerweise steht $x^{(1)}$ für die bisherige Ausführung und $x^{(0)}$ für eine Baseline (z. B. keine Ausgaben für einen bestimmten Channel).
$b_ {i}$ Budget: Das Gesamtbudget, das während der Budgetoptimierung einem bestimmten Channel $i$ zugewiesen wurde.
$\omega$ Skalierungsfaktor für Ausgaben: Ein Multiplikator, mit dem historische Ausgaben nach oben oder unten skaliert werden. Wird mathematisch verwendet, um Reaktionskurven zu generieren oder den Grenz-ROI zu berechnen.
$f^*$ Angestrebte/optimale Häufigkeit: Die optimale durchschnittliche Anzeigenhäufigkeit, die bei der Optimierung von Reichweite und Häufigkeit ermittelt wird.
$(j)$ Hochgestellter Index für MCMC-Ziehungen: Bezeichnet eine bestimmte Simulationsziehung (eine von Tausenden von möglichen Antworten, die vom Modell generiert werden), die zur Berechnung des Posterior-Mittelwerts des erwarteten Ergebnisses verwendet wird.