Définissez les variables d'index suivantes :
- \(g=1,\ldots,G\) indexe les unités géographiques.
\(t=1,\ldots,T\) indexe les unités temporelles.
Pour les variables média payant ou naturel, les données des périodes \(t<1\) peuvent être incluses dans les données d'entrée du modèle afin de modéliser précisément les effets différés dans les périodes antérieures. Si aucune donnée n'est fournie pour \(t<1\) , nous estimons qu'il n'y a pas d'exécution média avant \(t=1\).
\(i=1,\ldots,N_C\) indexe les variables de contrôle.
\(i=1,\ldots,N_N\) indexe les traitements non média
\(i=1,\ldots,N_M\) indexe les canaux média payant sans données de couverture et de fréquence.
\(i=1,\ldots, N_{OM}\) indexe les canaux média naturel sans données de couverture et de fréquence.
\(i=1,\ldots,N_{RF}\) indexe les canaux média payant avec données de couverture et de fréquence.
\(i=1,\ldots, N_{ORF}\) indexe les canaux média naturel avec données de couverture et de fréquence.
Meridian nécessite deux tableaux de données principaux en tant qu'entrées du modèle (KPI et médias payants). Les traitements média naturel et non média peuvent également être fournis en tant qu'entrées facultatives, s'ils sont disponibles. Pour les canaux média payant et naturel dont les données de couverture et de fréquence sont disponibles par zone géographique et par période, ces données peuvent éventuellement être utilisées à la place d'une seule métrique média. Vous pouvez également inclure des contrôles qui sont des variables de confusion ou des prédicteurs forts du KPI. Il est préférable de fournir des données sur les revenus (si le KPI ne concerne pas les revenus) et sur les dépenses média (si l'unité média n'est pas une dépense), ce qui permet de convertir les unités en valeur monétaire pour les calculs du ROI.
Données | Dimensions | Entrée du modèle : unités brutes | Entrée du modèle : valeur unitaire | Unités transformées (utilisées dans l'équation du modèle) | Valeur/Coût |
---|---|---|---|---|---|
KPI | $$G \times T$$ | $$\overset{\cdot \cdot}{y}_{g,t}$$ | $$u^{[Y]}_{g,t}$$ | $$y_{g,t} = L^{[Y]}_{g,t} (\overset{\cdot \cdot}{y}_{g,t})$$ | $$\overset{\sim}y_{g,t} = u^{[Y]}_{g,t} \cdot \overset{\cdot \cdot}{y}_{g,t}$$ |
Contrôles | $$G \times T \times N_C$$ | $$\overset{\cdot \cdot}{z}_{g,t,i}$$ | $$\text{N/A}$$ | $$z_{g,t,i} = L^{[C]}_{g,i}(\overset{\cdot \cdot}{z}_{g,t,i})$$ | $$\text{N/A}$$ |
Média | $$G \times T \times N_M$$ | $$\overset{\cdot \cdot}{x}^{[M]}_{g,t,i}$$ | $$u^{[M]}_{g,t,i}$$ | $$x^{[M]}_{g,t,i} = L^{[M]}_{g,i}(\overset{\cdot \cdot}{x}^{[M]}_{g,t,i})$$ | $$\overset{\sim}x_{g,t,i}^{[M]} = u^{[M]}_{g,t,i}\cdot\overset{\cdot \cdot}{x}^{[M]}_{g,t,i}$$ |
Couverture | $$G \times T \times N_{RF}$$ | $$\overset{\cdot \cdot}{r}^{[RF]}_{g,t,i}$$ | $$u^{[RF]}_{g,t,i}$$ | $$r_{g,t,i} = L^{[RF]}_{g,i}(\overset{\cdot \cdot}{r}^{[RF]}_{g,t,i})$$ | $$\overset{\sim}r^{[RF]}_{g,t,i} = u^{[RF]}_{g,t,i} \cdot \overset{\cdot \cdot}{r}^{[RF]}_{g,t,i} \cdot f^{[RF]}_{g,t,i}$$ |
Fréquence | $$G \times T \times N_{RF}$$ | $$f^{[RF]}_{g,t,i}$$ | $$\text{N/A}$$ | ||
Média naturel | $$G \times T \times N_{OM}$$ | $$\overset{\cdot \cdot}{x}^{[OM]}_{g,t,i}$$ | $$u^{[OM]}_{g,t,i}$$ | $$x^{[OM]}_{g,t,i} = L^{[OM]}_{g,i}(\overset{\cdot \cdot}{x}^{[OM]}_{g,t,i})$$ | $$\overset{\sim}x^{[OM]}_{g,t,i} = u^{[OM]}_{g,t,i}\cdot\overset{\cdot \cdot}{x}^{[OM]}_{g,t,i}$$ |
Couverture naturelle | $$G \times T \times N_{ORF}$$ | $$\overset{\cdot \cdot}{r}^{[ORF]}_{g,t,i}$$ | $$u^{[ORF]}_{g,t,i}$$ | $$r^{[ORF]}_{g,t,i} = L^{[ORF]}_{g,i}(\overset{\cdot \cdot}{r}^{[ORF]}_{g,t,i})$$ | $$\overset{\sim}r^{[ORF]}_{g,t,i} = u^{[ORF]}_{g,t,i} \cdot \overset{\cdot \cdot}{r}^{[ORF]}_{g,t,i} \cdot f^{[ORF]}_{g,t,i}$$ |
Fréquence naturelle | $$G \times T \times N_{ORF}$$ | $$f^{[ORF]}_{g,t,i}$$ | $$\text{N/A}$$ | ||
Traitements non média | $$G \times T \times N_N$$ | $$\overset{\cdot \cdot}{x}^{[N]}_{g,t,i}$$ | $$\text{N/A}$$ | $$x^{N}_{g,t,i} = L^{N}_{g,i}(\overset{\cdot \cdot}{x}^{N}_{g,t,i})$$ | $$\text{N/A}$$ |
Les transformations unitaires sont gérées en interne par Meridian. La mise à l'échelle de la population géographique est nécessaire pour que la modélisation hiérarchique place toutes les zones géographiques sur une échelle comparable. Une autre standardisation est effectuée afin que les distributions a priori standardisées puissent être utilisées, sans avoir à prendre en compte l'échelle de chaque variable.
Définissez \(p_g\) comme la taille de la population de chaque zone géographique, ce qui constitue une autre entrée du modèle que l'utilisateur doit spécifier. Les transformations linéaires sont résumées comme suit :
Transformation : unités de KPI
Les unités de KPI sont mises à l'échelle en fonction de la population pour placer toutes les zones géographiques sur une échelle comparable. Ainsi, il n'est pas nécessaire de mettre à l'échelle les paramètres du modèle en fonction de la taille de la population.
Après la mise à l'échelle de la population, le KPI est normalisé pour obtenir une moyenne nulle et un écart-type de 1. Le centrage sur la moyenne nulle permet de choisir raisonnablement un a priori centré sur zéro pour les termes d'interception (knot_values
et tau_g
). La mise à l'échelle sur l'écart type 1 place les paramètres sur une échelle permettant d'attribuer des a priori par défaut raisonnables.
Notation : \(L^{[Y]}_{g,t} (\cdot)\)
Description :
- Divisez par la population géographique.
- Centrez et mettez à l'échelle les valeurs ajustées selon la zone géographique pour obtenir une moyenne nulle et un écart-type de 1.
Définition :
\(L^{[Y]}_{g,t} (q) = \dfrac{\dfrac{q}{p_g} - m^{[Y]}}{s^{[Y]}}\)
Où :
- \(y^\dagger_{g,t} = \dfrac{\overset {\cdot \cdot} y_{g,t}}{p_g}\)
- \(m^{[Y]} = \frac{1}{GT}\sum\limits_{g,t} y^\dagger_{g,t}\)
- \(s^{[Y]} = \sqrt{\frac{1}{GT-1} \sum\limits_{g,t} \left( y^\dagger_{g,t}-m^{[Y]} \right)^2}\)
Transformation : variables de contrôle
Les variables de contrôle ne doivent être mises à l'échelle en fonction de la population que si les valeurs sont approximativement proportionnelles à la taille de la population. Meridian inclut des coefficients d'effets aléatoires propres à chaque zone géographique (gamma_gc
). Il est toutefois préférable de mettre à l'échelle la variable plutôt que de s'appuyer sur l'adéquation du modèle pour obtenir des coefficients qui évoluent en fonction de la taille de la population.
Les variables de contrôle sont normalisées pour obtenir une moyenne nulle et un écart type de 1.
Le centrage sur la moyenne nulle permet de choisir raisonnablement un a priori centré sur zéro pour les termes d'interception (knot_values
et tau_g
). La mise à l'échelle sur l'écart-type 1 place la moyenne des coefficients (gamma_c
) sur une échelle permettant d'attribuer un a priori par défaut non informatif raisonnable.
Notation : \(L^{[C]}_{g,i} (\cdot)\)
Description :
Il peut être judicieux de mettre à l'échelle la population pour certains contrôles. Pour cela, vous pouvez utiliser l'argument
control_population_scaling_id
. Par défaut, aucun contrôle n'est mis à l'échelle selon la population.Centrez et mettez à l'échelle chaque variable de contrôle pour obtenir une moyenne nulle et un écart-type de 1.
Définition :
\(L^{[C]}_{g,i}(q) = \dfrac{\dfrac{q}{p^{I^{[C]}_i}_g} - m^{[C]}}{s^{[C]}}\)
Où :
\(I_i^{[C]} = 1\) si
control_population_scaling_id=True
est utilisé pour la variable ( \(i;0\) dans le cas contraire).- \(z^{\dagger}_{g,t,i} = \dfrac{\overset {\cdot \cdot} z_{g,t,i}}{p_g^{I_i^{[C]}}}\)
- \(m^{[C]} = \frac{1}{GT}\sum\limits_{g,t} z^{\dagger}_{g,t,i}\)
- \(s^{[C]} = \sqrt{\frac{1}{GT-1} \sum\limits_{g,t} \left( z^{\dagger}_{g,t,i}-m^{[C]} \right)^2}\)
Transformation : unités média
Les unités média sont mises à l'échelle en fonction de la population pour placer toutes les zones géographiques sur une échelle comparable.
Ainsi, il n'est pas nécessaire de mettre à l'échelle les paramètres de demi-saturation (ec_m
) en fonction de la taille de la population.
Les unités média sont ensuite mises à l'échelle en fonction de la valeur médiane non nulle pour chaque canal. Cela permet d'interpréter le paramètre ec_m
de manière plus intuitive. Ainsi, une valeur ec_m
égale à 1 implique que le point de demi-saturation se produit à la médiane des unités média non nulles par personne.
Notation : \(L^{[M]}_{g,i} (\cdot)\)
Description :
- Divisez par la population géographique.
- Pour chaque canal média, mettez à l'échelle les valeurs ajustées selon la zone géographique à l'aide de la valeur médiane non nulle.
Définition :
\(L^{[M]}_{g,i} (q) = \dfrac{q}{p_g d^{[M]}}\)
Où :
- \(x^{\dagger [M]}_{g,t,i} = \dfrac{\overset {\cdot \cdot} x_{g,t,i}^{[M]}}{p_g}\)
- \(d^{[M]} = \text{Median}\left( \left\{ x^{\dagger [M]}_{g,t,i}:x^{\dagger [M]}_{g,t,i} > 0 \right\}_{g,t} \right)\)
Transformation : couverture
La couverture est mise à l'échelle en fonction de la population pour placer toutes les zones géographiques sur une échelle comparable. Meridian inclut des coefficients d'effets aléatoires propres à chaque zone géographique (beta_grf
). Il est toutefois préférable de mettre à l'échelle la variable plutôt que de s'appuyer sur l'adéquation du modèle pour obtenir des coefficients qui évoluent en fonction de la taille de la population.
La couverture est mise à l'échelle à l'aide de la valeur médiane non nulle pour chaque canal, ce qui fait de l'a priori par défaut de la moyenne des coefficients (beta_rf
) un choix raisonnable pour la plupart des ensembles de données. Notez que la mise à l'échelle selon la médiane n'a pas d'incidence sur la sélection de l'a priori, sauf si des a priori de coefficients sont utilisés.
Notation : \(L^{[RF]}_{g,i} (\cdot)\)
Description :
La fonction de transformation est identique à celle des unités média.
Transformation : unités média naturel
La transformation et la justification sont identiques à celles des unités média payant.
Notation : \(L^{[OM]}_{g,i} (\cdot)\)
Description :
- Divisez par la population géographique.
- Pour chaque canal média naturel, mettez à l'échelle les valeurs ajustées selon la zone géographique à l'aide de la valeur médiane non nulle.
Définition :
\(L^{[OM]}_{g,i} (q) = \dfrac{q}{p_g d^{[OM]}}\)
Où :
- \(x^{\dagger [OM]}_{g,t,i} = \dfrac{\overset {\cdot \cdot} x_{g,t,i}^{[OM]}}{p_g}\)
- \(d^{[OM]} = \text{Median}\left( \left\{ x^{\dagger [OM]}_{g,t,i}:x^{\dagger [OM]}_{g,t,i} > 0 \right\}_{g,t} \right)\)
Transformation : couverture naturelle
La transformation et la justification sont identiques à celles de la couverture des médias payants.
Notation : \(L^{[ORF]}_{g,i} (\cdot)\)
Description :
La fonction de transformation est identique à celle des unités média naturel.
Transformation : traitements non média
Les variables de traitement non média ne doivent être mises à l'échelle en fonction de la population que si les valeurs sont approximativement proportionnelles à la taille de la population. Meridian inclut des coefficients d'effets aléatoires propres à chaque zone géographique (gamma_gn
). Il est toutefois préférable de mettre à l'échelle la variable plutôt que de s'appuyer sur l'adéquation du modèle pour obtenir des coefficients qui évoluent en fonction de la taille de la population.
Les variables de traitement non média sont normalisées pour obtenir une moyenne nulle et un écart type de 1. Le centrage sur la moyenne nulle permet de choisir raisonnablement un a priori centré sur zéro pour les termes d'interception (knot_values
et tau_g
). La mise à l'échelle sur l'écart-type 1 place la moyenne des coefficients (gamma_n
) sur une échelle permettant d'attribuer un a priori par défaut raisonnable. Notez que la mise à l'échelle selon la médiane n'a pas d'incidence sur la sélection de l'a priori, sauf si des a priori de coefficients sont utilisés.
Notation : \(L^{[N]}_{g,i} (\cdot)\)
Description :
Il peut être judicieux de mettre à l'échelle certains traitements non média en fonction de la population. Pour cela, vous pouvez utiliser l'argument
non_media_population_scaling_id
. Par défaut, les traitements non média ne sont pas mis à l'échelle selon la population.Centrez et mettez à l'échelle chaque variable de traitement non média pour obtenir une moyenne nulle et un écart type de 1.
Définition :
\(L^{[N]}_{g,i}(q) = \dfrac{\dfrac{q}{p^{I^{[N]}_i}_g} - m^{[N]}}{s^{[N]}}\)
Où :
\(I_i^{[N]} = 1\) si
non_media_population_scaling_id=True
est utilisé pour la variable ( \(i;0\) dans le cas contraire).- \(X^{\dagger [N]}_{g,t,i} = \dfrac{\overset {\cdot \cdot} x_{g,t,i}}{p_g^{I_i^{[N]}}}\)
- \(m^{[N]} = \frac{1}{GT}\sum\limits_{g,t} x^{\dagger [N]}_{g,t,i}\)
- \(s^{[N]} = \sqrt{\frac{1}{GT-1} \sum\limits_{g,t} \left( x^{\dagger [N]}_{g,t,i}-m^{[N]} \right)^2}\)