Stimare il risultato incrementale utilizzando la regressione

In base alle ipotesi di scambiabilità e coerenza, l'aspettativa condizionata di qualsiasi potenziale risultato \(\overset \sim Y_{g,t}^{ \left(\left\{ x_{g,t,i}^{(\ast)} \right\}\right) }\) può essere scritta in termini di un'aspettativa condizionata che può essere stimata da un modello di regressione, dove\(x_{g,t,i}^{(\ast)}\) rappresenta l'insieme di variabili di trattamento su cui è possibile intervenire: media, media organici e trattamenti non media. A scopo dimostrativo, assumiamo che i canali media organici e a pagamento qui indicati siano basati sulle impressioni, anche se quanto segue vale anche per i canali basati su copertura e frequenza.

Dalle definizioni descritte in Input data, questo può essere scritto come:

$$ \begin{align*} \overset \sim Y_{g,t} &= u_{g,t}^{[Y]} \overset {\cdot \cdot} Y_{g,t} \\ &= u_{g,t}^{[Y]}L_{g,t}^{[Y]-1}(Y_{g,t}) \end{align*} $$

Meridian sfrutta anche il fatto che la funzione di trasformazione del KPI pre-modellazione \(L_{g,t}^{[Y]}(\cdot)\) è lineare e pertanto può essere passata all'esterno dell'operatore di aspettativa condizionale. Il risultato è la seguente uguaglianza, dove il risultato è una quantità che può essere stimata da un modello di regressione, come il modello Meridian:

$$ \begin{align*} E\left(\overset \sim Y_{g,t}^{(\left\{ x_{g,t,i}^{(\ast)} \right\})} \Big| \bigl\{ z_{g,t,i} \bigr\} \right) &= E\left( \overset \sim Y_{g,t} \Big| \bigl\{x_{g,t,i}^{(\ast)}\bigr\}, \bigl\{z_{g,t,i}\bigr\} \right) \\ &= E\left( u_{g,t}^{[Y]}L_{g,t}^{[Y]-1}(Y_{g,t}) \Big| \bigl\{ x_{g,t,i}^{(\ast)} \bigr\}, \bigl\{z_{g,t,i}\bigr\} \right) \\ &= u_{g,t}^{[Y]}L_{g,t}^{[Y]-1} E\left( Y_{g,t} \Big| \bigl\{ x_{g,t,i}^{(\ast)} \bigr\}, \bigl\{z_{g,t,i}\bigr\} \right) \end{align*} $$

In base a questo, la regressione può essere utilizzata per stimare il risultato incrementale tra due scenari controfattuali \(\left\{ x_{g,t,i}^{(1)} \right\}\) e \(\left\{ x_{g,t,i}^{(0)} \right\}\):

$$ \begin{align*} \text{IncrementalOutcome} \left( \bigl\{ x_{g,t,i}^{(1)} \bigr\}, \bigl\{ x_{g,t,i}^{(0)} \bigr\} \right) &= E\left( \sum\limits_{g,t}\left( \overset \sim Y_{g,t}^{ \left( \left\{ x_{g,t,i}^{(1)} \right\} \right) } - \overset \sim Y_{g,t}^{ \left( \left\{ x_{g,t,i}^{(0)} \right\} \right) } \right) \Bigg| \bigl\{ z_{g,t,i} \bigr\} \right) \\ &= \sum\limits_{g,t}u_{g,t}^{[Y]}L_g^{[Y]-1} \left( E\left( Y_{g,t} \Big| \bigl\{ x_{g,t,i}^{(1)} \bigr\}, \bigl\{ z_{g,t,i} \bigr\} \right)\right) - \sum\limits_{g,t}u_{g,t}^{[Y]}L_{g,t}^{[Y]-1} \left( E\left( Y_{g,t} \Big| \bigl\{ x_{g,t,i}^{(0)} \bigr\}, \bigl\{ z_{g,t,c} \bigr\} \right) \right) \end{align*} $$

Nella specifica del modello Meridian:

$$ \begin{align*} E\left( Y_{g,t} \Big| \bigl\{ x_{g,t,i}^{(\ast)} \bigr\}, \bigl\{ z_{g,t,i} \bigr\} \right) = \mu_t &+ \tau_g + \sum\limits_{i=1}^{N_C} \gamma^{[C]}_{g,i}z_{g,t,i} \\ &+ \sum\limits_{i=1}^{N_N} \gamma^{[N]}_{g,i}x^{[N] (\ast)}_{g,t,i} \\ &+ \sum\limits_{i=1}^{N_M} \beta^{[M]}_{g,i} \text{HillAdstock} \left( \bigl\{ x^{[M] (\ast)}_{g,t-s,i} \bigr\}^L_{s=0};\ \alpha^{[M]}_i, ec^{[M]}_i, \text{slope}^{[M]}_i \right) \\ &+ \sum\limits_{i=1}^{N_{OM}} \beta^{[OM]}_{g,i} \text{HillAdstock} \left( \bigl\{ x^{[OM] (\ast)}_{g,t-s,i} \bigr\}^L_{s=0};\ \alpha^{[OM]}_i, ec^{[OM]}_i, \text{slope}^{[OM]}_i \right) \end{align*} $$

Questa quantità è una funzione dei parametri del modello e, pertanto, ha una distribuzione post-previsione che Meridian può campionare utilizzando la catena di Markov Monte Carlo (MCMC). Il ROI, il mROI e le curve di risposta possono essere calcolati in base alla definizione di risultato incrementale e ciascuna di queste quantità ha anche una distribuzione a posteriori.