Definieren Sie die folgenden Indexvariablen:
- \(g=1,\ldots,G\) indexiert die geografischen Einheiten.
\(t=1,\ldots,T\) indexiert die Zeiteinheiten.
Bei kostenpflichtigen und organischen Media-Variablen können Daten für Zeiträume \(t<1\) in die Modell-Eingabedaten aufgenommen werden, um verzögerte Effekte in den früheren Zeiträumen genau zu modellieren. Wenn keine Daten für \(t<1\) angegeben sind, wird davon ausgegangen, dass vor \(t=1\)keine Media-Ausführung erfolgt.
\(i=1,\ldots,N_C\) indexiert die Kontrollvariablen.
\(i=1,\ldots,N_N\) indexiert die nicht mediabezogenen Testvariablen.
\(i=1,\ldots,N_M\) indexiert die kostenpflichtigen Media-Channels ohne Daten zu Reichweite und Häufigkeit.
\(i=1,\ldots, N_{OM}\) indexiert die organischen Media-Channels ohne Daten zu Reichweite und Häufigkeit.
\(i=1,\ldots,N_{RF}\) indexiert die kostenpflichtigen Media-Channels mit Daten zu Reichweite und Häufigkeit.
\(i=1,\ldots, N_{ORF}\) indexiert die organischen Media-Channels mit Daten zu Reichweite und Häufigkeit.
Für Meridian sind zwei Hauptdatenarrays als Modelleingaben erforderlich: KPI und kostenpflichtige Media. Wenn verfügbar, können auch organische Media und nicht mediabezogene Testvariablen als optionale Eingaben verwendet werden. Bei kostenpflichtigen und organischen Media-Channels mit Daten zu Reichweite und Häufigkeit nach geografischer Einheit und Zeitraum können diese Daten optional anstelle eines einzelnen Media-Messwerts verwendet werden. Sie können auch Kontrollvariablen einbeziehen, die Störvariablen oder starke Vorhersagevariablen für die KPI sind. Es empfiehlt sich, Umsatzdaten anzugeben (falls der KPI nicht „Umsatz“ ist) und Daten zu Media-Ausgaben (falls die Media-Einheit nicht „Ausgaben“ ist). So können Einheiten für ROI-Berechnungen in einen Währungswert umgewandelt werden.
Daten | Dimensionen | Modelleingabe: Roheinheiten | Modelleingabe: Einheitswert | Transformierte Einheiten (in der Modellgleichung verwendet) | Wert/Kosten |
---|---|---|---|---|---|
KPI | $$G \times T$$ | $$\overset{\cdot \cdot}{y}_{g,t}$$ | $$u^{[Y]}_{g,t}$$ | $$y_{g,t} = L^{[Y]}_{g,t} (\overset{\cdot \cdot}{y}_{g,t})$$ | $$\overset{\sim}y_{g,t} = u^{[Y]}_{g,t} \cdot \overset{\cdot \cdot}{y}_{g,t}$$ |
Kontrollvariablen | $$G \times T \times N_C$$ | $$\overset{\cdot \cdot}{z}_{g,t,i}$$ | $$\text{N/A}$$ | $$z_{g,t,i} = L^{[C]}_{g,i}(\overset{\cdot \cdot}{z}_{g,t,i})$$ | $$\text{N/A}$$ |
Media | $$G \times T \times N_M$$ | $$\overset{\cdot \cdot}{x}^{[M]}_{g,t,i}$$ | $$u^{[M]}_{g,t,i}$$ | $$x^{[M]}_{g,t,i} = L^{[M]}_{g,i}(\overset{\cdot \cdot}{x}^{[M]}_{g,t,i})$$ | $$\overset{\sim}x_{g,t,i}^{[M]} = u^{[M]}_{g,t,i}\cdot\overset{\cdot \cdot}{x}^{[M]}_{g,t,i}$$ |
Reichweite | $$G \times T \times N_{RF}$$ | $$\overset{\cdot \cdot}{r}^{[RF]}_{g,t,i}$$ | $$u^{[RF]}_{g,t,i}$$ | $$r_{g,t,i} = L^{[RF]}_{g,i}(\overset{\cdot \cdot}{r}^{[RF]}_{g,t,i})$$ | $$\overset{\sim}r^{[RF]}_{g,t,i} = u^{[RF]}_{g,t,i} \cdot \overset{\cdot \cdot}{r}^{[RF]}_{g,t,i} \cdot f^{[RF]}_{g,t,i}$$ |
Häufigkeit | $$G \times T \times N_{RF}$$ | $$f^{[RF]}_{g,t,i}$$ | $$\text{N/A}$$ | ||
Organische Media | $$G \times T \times N_{OM}$$ | $$\overset{\cdot \cdot}{x}^{[OM]}_{g,t,i}$$ | $$u^{[OM]}_{g,t,i}$$ | $$x^{[OM]}_{g,t,i} = L^{[OM]}_{g,i}(\overset{\cdot \cdot}{x}^{[OM]}_{g,t,i})$$ | $$\overset{\sim}x^{[OM]}_{g,t,i} = u^{[OM]}_{g,t,i}\cdot\overset{\cdot \cdot}{x}^{[OM]}_{g,t,i}$$ |
Organische Reichweite | $$G \times T \times N_{ORF}$$ | $$\overset{\cdot \cdot}{r}^{[ORF]}_{g,t,i}$$ | $$u^{[ORF]}_{g,t,i}$$ | $$r^{[ORF]}_{g,t,i} = L^{[ORF]}_{g,i}(\overset{\cdot \cdot}{r}^{[ORF]}_{g,t,i})$$ | $$\overset{\sim}r^{[ORF]}_{g,t,i} = u^{[ORF]}_{g,t,i} \cdot \overset{\cdot \cdot}{r}^{[ORF]}_{g,t,i} \cdot f^{[ORF]}_{g,t,i}$$ |
Organische Häufigkeit | $$G \times T \times N_{ORF}$$ | $$f^{[ORF]}_{g,t,i}$$ | $$\text{N/A}$$ | ||
Nicht mediabezogene Testvariablen | $$G \times T \times N_N$$ | $$\overset{\cdot \cdot}{x}^{[N]}_{g,t,i}$$ | $$\text{N/A}$$ | $$x^{N}_{g,t,i} = L^{N}_{g,i}(\overset{\cdot \cdot}{x}^{N}_{g,t,i})$$ | $$\text{N/A}$$ |
Einheitentransformationen werden intern von Meridian verarbeitet. Die Skalierung der geografischen Bevölkerung ist für die hierarchische Modellierung erforderlich, um alle geografischen Einheiten auf eine vergleichbare Skala zu bringen. Andere Standardisierungen werden durchgeführt, damit standardisierte Prior-Verteilungen verwendet werden können, ohne dass die Skalierung der einzelnen Variablen berücksichtigt werden muss.
Definieren Sie \(p_g\) als die Bevölkerungszahl der einzelnen geografischen Einheiten. Dies ist eine weitere Modelleingabe, die vom Nutzer angegeben werden muss. Die linearen Transformationen werden so zusammengefasst:
Transformation: KPI-Einheiten
KPI-Einheiten an die Grundgesamtheit anpassen, um alle geografischen Einheiten ungefähr auf die gleiche Skala zu bringen. So müssen die Modellparameter nicht mit der Bevölkerungszahl skaliert werden.
Nach der Skalierung der Bevölkerungsgröße den KPI normalisieren, sodass der Mittelwert 0 und die Standardabweichung 1 ist. Wenn Sie den Mittelwert durch Zentrieren auf 0 setzen, ist es sinnvoll, für die Intercepts (knot_values
und tau_g
) einen Prior zu wählen, der auf 0 zentriert ist. Falls Sie durch Skalieren eine Standardabweichung von 1 festlegen, werden die Parameter so skaliert, dass sinnvolle Standard-Priors zugewiesen werden können.
Notation: \(L^{[Y]}_{g,t} (\cdot)\)
Beschreibung:
- Durch die geografische Bevölkerung teilen.
- Die geoskalierten Werte so zentrieren und skalieren, dass der Mittelwert 0 und die Standardabweichung 1 ist.
Definition:
\(L^{[Y]}_{g,t} (q) = \dfrac{\dfrac{q}{p_g} - m^{[Y]}}{s^{[Y]}}\)
Dabei gilt:
- \(y^\dagger_{g,t} = \dfrac{\overset {\cdot \cdot} y_{g,t}}{p_g}\)
- \(m^{[Y]} = \frac{1}{GT}\sum\limits_{g,t} y^\dagger_{g,t}\)
- \(s^{[Y]} = \sqrt{\frac{1}{GT-1} \sum\limits_{g,t} \left( y^\dagger_{g,t}-m^{[Y]} \right)^2}\)
Transformation: Kontrollvariablen
Kontrollvariablen müssen nur dann an die Grundgesamtheit angepasst werden, wenn die Werte ungefähr mit der Bevölkerungszahl skaliert werden. Meridian umfasst Zufallseffekt-Koeffizienten für bestimmte geografische Einheiten (gamma_gc
). Es ist jedoch besser, die Variable zu skalieren, anstatt sich auf die Modellanpassung zu verlassen, um Koeffizienten zu erhalten, die mit der Bevölkerungszahl skaliert werden.
Kontrollvariablen normalisieren, sodass der Mittelwert 0 und die Standardabweichung 1 ist.
Wenn Sie den Mittelwert durch Zentrieren auf 0 setzen, ist es sinnvoll, für die Intercepts (knot_values
und tau_g
) einen Prior zu wählen, der auf 0 zentriert ist. Falls Sie durch Skalieren eine Standardabweichung von 1 festlegen, wird der Koeffizienten-Medianwert (gamma_c
) so skaliert, dass ein sinnvoller nicht informativer Standard-Prior zugewiesen werden kann.
Notation: \(L^{[C]}_{g,i} (\cdot)\)
Beschreibung:
Für bestimmte Kontrollvariablen kann es sinnvoll sein, eine Skalierung der Bevölkerungsgröße vorzunehmen. Dazu kann das Argument
control_population_scaling_id
verwendet werden. Standardmäßig werden Kontrollvariablen nach Bevölkerungszahl skaliert.Die einzelnen Kontrollvariablen so zentrieren und skalieren, dass der Mittelwert 0 und die Standardabweichung 1 ist.
Definition:
\(L^{[C]}_{g,i}(q) = \dfrac{\dfrac{q}{p^{I^{[C]}_i}_g} - m^{[C]}}{s^{[C]}}\)
Dabei gilt:
\(I_i^{[C]} = 1\) , wenn
control_population_scaling_id=True
für die Variable verwendet wird, sonst \(i;0\) .- \(z^{\dagger}_{g,t,i} = \dfrac{\overset {\cdot \cdot} z_{g,t,i}}{p_g^{I_i^{[C]}}}\)
- \(m^{[C]} = \frac{1}{GT}\sum\limits_{g,t} z^{\dagger}_{g,t,i}\)
- \(s^{[C]} = \sqrt{\frac{1}{GT-1} \sum\limits_{g,t} \left( z^{\dagger}_{g,t,i}-m^{[C]} \right)^2}\)
Transformation: Media-Einheiten
Media-Einheiten an die Grundgesamtheit anpassen, um alle geografischen Einheiten ungefähr auf die gleiche Skala zu bringen.
So müssen die Halbsättigungsparameter (ec_m
) nicht mit der Bevölkerungszahl skaliert werden.
Die Media-Einheiten dann für jeden Channel mit dem Medianwert skalieren, der nicht 0 ist. So lässt sich der Parameter ec_m
intuitiver auswerten. Der Wert 1 für ec_m
bedeutet, dass der Halbsättigungspunkt beim Medianwert der nicht nullwertigen Media-Einheiten pro Kopf eintritt.
Notation: \(L^{[M]}_{g,i} (\cdot)\)
Beschreibung:
- Durch die geografische Bevölkerung teilen.
- Die geoskalierten Werte für jeden Media-Channel mit dem Medianwert skalieren, der nicht 0 ist.
Definition:
\(L^{[M]}_{g,i} (q) = \dfrac{q}{p_g d^{[M]}}\)
Dabei gilt:
- \(x^{\dagger [M]}_{g,t,i} = \dfrac{\overset {\cdot \cdot} x_{g,t,i}^{[M]}}{p_g}\)
- \(d^{[M]} = \text{Median}\left( \left\{ x^{\dagger [M]}_{g,t,i}:x^{\dagger [M]}_{g,t,i} > 0 \right\}_{g,t} \right)\)
Transformation: Reichweite
Die Reichweite an die Grundgesamtheit anpassen, um alle geografischen Einheiten ungefähr auf die gleiche Skala zu bringen. Meridian umfasst Zufallseffekt-Koeffizienten für bestimmte geografische Einheiten (beta_grf
). Es ist jedoch besser, die Variable zu skalieren, anstatt sich auf die Modellanpassung zu verlassen, um Koeffizienten zu erhalten, die mit der Bevölkerungszahl skaliert werden.
Die Reichweite für jeden Channel mit dem Medianwert skalieren, der nicht 0 ist. Daher ist der Standardkoeffizienten-Mittelwert-Prior (beta_rf
) für die meisten Datensätze eine angemessene Wahl. Die Skalierung nach dem Medianwert hat keine Auswirkungen auf die Prior-Auswahl, es sei denn, es werden Koeffizienten-Priors verwendet.
Notation: \(L^{[RF]}_{g,i} (\cdot)\)
Beschreibung:
Die Transformationsfunktion ist dieselbe wie für Media-Einheiten.
Transformation: Einheiten organischer Medien
Transformation und Begründung sind mit denen von kostenpflichtigen Media-Einheiten identisch.
Notation: \(L^{[OM]}_{g,i} (\cdot)\)
Beschreibung:
- Durch die geografische Bevölkerung teilen.
- Die geoskalierten Werte für jeden organischen Media-Channel mit dem Medianwert skalieren, der nicht 0 ist.
Definition:
\(L^{[OM]}_{g,i} (q) = \dfrac{q}{p_g d^{[OM]}}\)
Dabei gilt:
- \(x^{\dagger [OM]}_{g,t,i} = \dfrac{\overset {\cdot \cdot} x_{g,t,i}^{[OM]}}{p_g}\)
- \(d^{[OM]} = \text{Median}\left( \left\{ x^{\dagger [OM]}_{g,t,i}:x^{\dagger [OM]}_{g,t,i} > 0 \right\}_{g,t} \right)\)
Transformation: Organische Reichweite
Transformation und Begründung sind mit denen der Reichweite von kostenpflichtigen Media identisch.
Notation: \(L^{[ORF]}_{g,i} (\cdot)\)
Beschreibung:
Die Transformationsfunktion ist dieselbe wie für organische Media-Einheiten.
Transformation: Nicht mediabezogene Testvariablen
Nicht mediabezogene Testvariablen müssen nur dann an die Grundgesamtheit angepasst werden, wenn die Werte ungefähr mit der Bevölkerungszahl skaliert werden. Meridian umfasst Zufallseffekt-Koeffizienten für bestimmte geografische Einheiten (gamma_gn
). Es ist jedoch besser, die Variable zu skalieren, anstatt sich auf die Modellanpassung zu verlassen, um Koeffizienten zu erhalten, die mit der Bevölkerungszahl skaliert werden.
Nicht mediabezogene Testvariablen normalisieren, sodass der Mittelwert 0 und die Standardabweichung 1 ist. Wenn Sie den Mittelwert durch Zentrieren auf 0 setzen, ist es sinnvoll, für die Intercepts (knot_values
und tau_g
) einen Prior zu wählen, der auf 0 zentriert ist. Falls Sie durch Skalieren eine Standardabweichung von 1 festlegen, wird der Koeffizienten-Medianwert-Parameter (gamma_n
) so skaliert, dass ein sinnvoller Standard-Prior zugewiesen werden kann. Die Skalierung nach dem Medianwert hat keine Auswirkungen auf die Prior-Auswahl, es sei denn, es werden Koeffizienten-Priors verwendet.
Notation: \(L^{[N]}_{g,i} (\cdot)\)
Beschreibung:
Für bestimmte nicht mediabezogene Testvariablen kann es sinnvoll sein, eine Anpassung an die Grundgesamtheit vorzunehmen. Dazu kann das Argument
non_media_population_scaling_id
verwendet werden. Nicht mediabezogene Testvariablen werden nicht standardmäßig an die Grundgesamtheit angepasst.Die einzelnen nicht mediabezogenen Testvariablen so zentrieren und skalieren, dass der Mittelwert 0 und die Standardabweichung 1 ist.
Definition:
\(L^{[N]}_{g,i}(q) = \dfrac{\dfrac{q}{p^{I^{[N]}_i}_g} - m^{[N]}}{s^{[N]}}\)
Dabei gilt:
\(I_i^{[N]} = 1\) , wenn
non_media_population_scaling_id=True
für die Variable verwendet wird, sonst \(i;0\) .- \(X^{\dagger [N]}_{g,t,i} = \dfrac{\overset {\cdot \cdot} x_{g,t,i}}{p_g^{I_i^{[N]}}}\)
- \(m^{[N]} = \frac{1}{GT}\sum\limits_{g,t} x^{\dagger [N]}_{g,t,i}\)
- \(s^{[N]} = \sqrt{\frac{1}{GT-1} \sum\limits_{g,t} \left( x^{\dagger [N]}_{g,t,i}-m^{[N]} \right)^2}\)