Nesta seção, descrevemos as distribuições a priori padrão para o modelo do Meridian. Todas elas são especificadas pelo argumento prior_distribution
, que aceita um objeto PriorDistribution
. Cada parâmetro tem o próprio argumento no construtor PriorDistribution
, e a distribuição a priori conjunta pressupõe que todas as distribuições são independentes.
Elas podem ser especificadas como um vetor (por exemplo, tfp.distributions.Normal([1, 2, 3], [1, 1, 2])
) ou como um escalar (por exemplo, tfp.distributions.Normal(1, 2)
). Todas as distribuições escalares são transmitidas para o comprimento do vetor de parâmetro que representam.
knot_values
Parâmetro: \(b_k\)
Distribuição a priori padrão: Normal(0, 5)
Justificativa:
- Distribuição a priori não informativa que determina quanto tempo um efeito pode ter.
- Não informativa, caso você queira permitir que o tempo tenha um efeito mais significativo.
- O aprendizado pode acontecer com dados que recebem várias regiões por período e também vários períodos por nó, quando o número de nós é baixo.
tau_g_excl_baseline
Parâmetro: \(\tau_g\)
Distribuição a priori padrão: Normal(0, 5)
Justificativa:
- Distribuição a priori não informativa que determina diferenças geográficas.
- Não informativa, caso você queira permitir que as regiões geográficas tenham um efeito mais significativo.
- O aprendizado pode acontecer com dados que recebem vários períodos por regiões.
roi_m
e roi_rf
Parâmetro: \(\text{ROI}_i^{[M]},\text{ROI}_{i}^{[RF]}\)
Distribuição a priori padrão: LogNormal(0.2, 0.9)
Justificativa:
- Essa distribuição indica que, a priori, o ROI da média de cada canal é 1,83, 50% dos ROIs são maiores que 1,22, 80% estão entre 0,5 e 6,0, 95% estão entre 0,25 e 9,0 e 99% são menores que 10,0.
- Se o KPI não for a receita e os dados de receita por KPI estiverem indisponíveis, uma distribuição a priori de ROI será colocada em todos os canais. Assim, a proporção do KPI que é incremental devido a todos os canais de mídia paga tem uma média a priori de 40% e um desvio padrão de 20% (chamada de "distribuição a priori da contribuição total de mídia paga"). Para mais considerações sobre esse padrão, consulte Distribuição a priori padrão da contribuição total de mídia paga.
- A distribuição padrão é estritamente positiva, o que é necessário quando os efeitos aleatórios do coeficiente de mídia são log-normal (
media_effects_dist='log_normal'
). Uma distribuição a priori que permite valores negativos pode ser usada quando os efeitos aleatórios sãomedia_effects_dist='normal'
, mas isso geralmente não é recomendado, porque pode inflar a variância a posteriori e causar problemas de convergência de amostragem MCMC.
mroi_m
e mroi_rf
Parâmetro: \(\text{mROI}_i^{[M]},\text{mROI}_{i}^{[RF]}\)
Distribuição a priori padrão: LogNormal(0.0, 0.5)
Justificativa:
- Essa distribuição indica que, a priori, o mROI médio de cada canal é 1,13, 50% dos mROIs são maiores que 1,0, 80% estão entre 0,53 e 1,90, 95% estão entre 0,33 e 2,66 e 99% são menores que 3,20.
- Por padrão, cada canal recebe a mesma distribuição a priori de mROI.
- Se o KPI não for receita e os dados de receita por KPI estiverem indisponíveis, o mROI anterior ainda poderá ser usado, mas você precisará especificar uma distribuição personalizada para
roi_m
eroi_rf
. Nesse caso, o mROI é interpretado como unidades de KPI incrementais por unidade de gasto (atribuído a um pequeno aumento no gasto).
contribution_m
, contribution_rf
, contribution_om
e contribution_orf
Parâmetro: \(\text{Contribution}_i^{[M]},\text{Contribution}_{i}^{[RF]}\), \(\text{Contribution}_i^{[OM]},\text{Contribution}_{i}^{[ORF]}\)
Distribuição a priori padrão: Beta(1.0, 99.0)
Justificativa:
- A distribuição a priori padrão indica que, a priori, a contribuição média de cada canal é de 1%, 50% dos valores de contribuição são maiores que 0,7%, 80% estão entre 0,1% e 2,3%, 95% estão entre 0,03% e 3,7% e 99% são menores que 4,5%.
- A distribuição padrão não permite que a contribuição de qualquer canal individual exceda 1,0 (100% do resultado observado). No entanto, isso não impede, necessariamente, que a contribuição combinada de vários canais ultrapasse 100%.
- A distribuição padrão é estritamente positiva, o que é necessário quando os efeitos aleatórios do coeficiente de mídia são log-normal (
media_effects_dist='log_normal'
). Uma distribuição a priori que permite valores negativos pode ser usada quando os efeitos aleatórios sãomedia_effects_dist='normal'
, mas isso geralmente não é recomendado, porque pode inflar a variância a posteriori e causar problemas de convergência de amostragem MCMC. - A distribuição padrão está bastante regularizada para mitigar a convergência de MCMC e problemas de valor de referência negativo. Defina uma distribuição a priori personalizada que seja adequada para seu caso de uso.
contribution_n
Parâmetro: \(\text{Contribution}_i^{[N]}\)
Distribuição a priori padrão: TruncatedNormal(0.0, 0.1, -1.0, 1.0)
Justificativa:
- A distribuição a priori padrão indica que, a priori, a contribuição média e mediana de cada canal é de 0% do total de resultados observados, 80% estão entre -12,8% e +12,8%, 95% estão entre -19,6% e +19,6% e 99% estão entre -25,8% e +25,8%.
- A distribuição a priori padrão permite valores negativos porque as variáveis não relacionadas à mídia podem ter uma contribuição negativa ou positiva, dependendo do tratamento e do valor de referência correspondente do tratamento. Se você já souber que a contribuição de uma variável específica é estritamente positiva ou negativa, isso deverá ser incorporado à distribuição a priori.
beta_m
, beta_rf
, beta_om
e beta_orf
Parâmetro: \(\beta_i^{[M]},\beta_{i}^{[RF]},\beta_{i}^{[OM]}, \beta_{i}^{[ORF]}\)
Distribuição a priori padrão: HalfNormal(5)
Justificativa:
- Distribuição a priori não informativa no parâmetro para a distribuição hierárquica de efeitos de mídia no nível geográfico para canais de mídia orgânica para canais de mídia paga de impressão e alcance e frequência, respectivamente (
beta_gom; beta_gorf
). Quandomedia_effects_dist
é definido como'normal'
, trata-se da média hierárquica. Quandomedia_effects_dist
é definido como'log_normal'
, ele representa o parâmetro hierárquico para a média da distribuiçãoNormal
, que passou a usar transformação logarítmica. - Distribuição a priori não informativa no parâmetro para a distribuição hierárquica de efeitos de mídia no nível geográfico para canais de mídia paga de impressão e alcance e frequência, respectivamente (
beta_gm; beta_grf
). Quandomedia_effects_dist
é definido como'normal'
, trata-se da média hierárquica. Quandomedia_effects_dist
é definido como'log_normal'
, ele representa o parâmetro hierárquico para a média da distribuiçãoNormal
, que passou a usar transformação logarítmica. - Não informativa, porque a interpretação de
beta_m
,beta_rf
,beta_om
ebeta_orf
pode variar bastante de acordo com transformações, dimensionamento e tipo de execução de mídia. - Por padrão, o Meridian usa distribuições a priori de ROI (
roi_m
eroi_rf
) para canais de mídia paga. Para usar distribuições a prioribeta_m
ebeta_rf
com mídia paga, definamedia_prior_type='coefficient'
erf_prior_type='coefficient'
. Por padrão, o Meridian usa distribuições a priori de contribuição com canais de mídia orgânica (
contribution_om
econtribution_orf
). Para usar distribuições a priori debeta_om
ebeta_orf
com mídia orgânica, definaorganic_media_prior_type='coefficient'
eorganic_rf_prior_type='coefficient'
.[M]
indica um canal de mídia paga com impressões.[RF]
indica um canal de mídia paga com alcance e frequência.[OM]
indica um canal de mídia orgânica com impressões.[ORF]
indica um canal de mídia orgânica com alcance e frequência.
eta_m
, eta_rf
, eta_om
e eta_orf
Parâmetro: \(\eta_i^{[M]},\eta_{i}^{[RF]},\eta_{i}^{[OM]}, \eta_{i}^{[ORF]}\)
Distribuição a priori padrão: HalfNormal(1)
Justificativa:
A regularização moderada incentiva pooling nas regiões. Isso gera estimativas de variância mais baixas, mas aumenta a viés e permite que o modelo use os dados com mais eficiência.
gamma_c
e gamma_n
Parâmetro: \(\gamma_i^{[C]},\gamma_i^{[N]}\)
Distribuição a priori padrão: Normal(0, 5)
Justificativa:
- Não informativa devido à grande quantidade de variáveis de controle ou de tratamento não relacionadas à mídia.
- Por padrão, o Meridian usa distribuições a priori de contribuição (
contribution_n
) com canais de tratamento que não são de mídia. Para usar distribuições a priorigamma_n
com tratamentos não relacionados à mídia, definanon_media_treatments_prior_type='coefficient'
.
xi_c
e xi_n
Parâmetro: \(\xi_i^{[C]},\xi_i^{[N]}\)
Distribuição a priori padrão: HalfNormal(5)
Justificativa:
- Não informativa para permitir um grande intervalo de variação geográfica nos efeitos das variáveis de controle e de tratamento não relacionadas à mídia.
- Por padrão, o pooling é mais fraco para efeitos de controle e de tratamento não relacionados à mídia do que para efeitos de mídia porque os efeitos de controle são lineares e simples (sem a complexidade das transformações de Hill e Adstock).
alpha_m
, alpha_rf
, alpha_om
e alpha_orf
Parâmetro: \(\alpha_i^{[M]},\alpha_{i}^{[RF]},\alpha_{i}^{[OM]}, \alpha_{i}^{[ORF]}\)
Distribuição a priori padrão: Uniform(0, 1)
Justificativa: não informativo para que os dados mostrem a taxa de decaimento.
ec_m
e ec_om
Parâmetro: \(ec_i^{[M]}, ec_{i}^{[OM]}\)
Distribuição a priori padrão: TruncatedNormal(0.8, 0.8, 0.1, 10)
. Essa é a distribuição condicional \(X|0.1 < X < 10\), em que \(X \sim N(0.8,0.8)\).
Justificativa:
- Os dados são dimensionados para que, quando \(ec=1\), a meia saturação ocorra na mediana das unidades médias não nulas per capita em todas as regiões e períodos.\(ec=X\) significa que a meia saturação acontecerá em \(X\) vezes a mediana das unidades médias não nulas per capita em todas as regiões e períodos.
- A média dessa distribuição a priori é próxima de um, o que é uma premissa razoável de onde acontece a meia saturação.
- O truncamento é feito para manter o parâmetro dentro de um intervalo razoável para a identificação.
- Se um canal estiver muito subsaturado (\(ec > 10\)) ou muito saturado (\(ec < 0.1\)), os dados não terão informações sobre o ponto de meia saturação. Nesses casos, o parâmetro
ec_m
determina o formato da curva de resposta, mas não deve ser interpretado como uma estimativa precisa de meia saturação.
ec_rf
e ec_orf
Parâmetro: \(ec_{i}^{[RF]},ec_{i}^{[ORF]}\)
Distribuição a priori padrão: LogNormal(0.7, 0.4) + 1
# Tensorflow Probability Syntax
tfp.distributions.TransformedDistribution(
tfp.distributions.LogNormal(0.7, 0.4),
tfp.bijectors.Shift(0.1)
)
Justificativa:
- Moderadamente informativo para evitar a não identificação com
slope_rf
. - Definido em conjunto com a distribuição a priori
slope_rf
para que a média da distribuição para frequência ideal seja 2,1 e tenha intervalo de confiança de 90% de[1.0, 4.4]
, que é considerado um intervalo razoável de frequência ideal.
slope_m
e slope_om
Parâmetro: \(\text{slope}_i^{[M]},\text{slope}_{i}^{[OM]}\)
Distribuição a priori padrão: Deterministic(1)
Justificativa:
- Aprendizado difícil por causa dos motivos de identificação.
Deterministic(1)
significa restrição às curvas côncavas de Hill.- O algoritmo de otimização do orçamento produz um valor global ideal quando as curvas de Hill são côncavas. Mudar essa distribuição a priori pode levar a curvas de Hill não côncavas e é possível que a otimização do orçamento não produza mais um valor global ideal.
slope_rf
e slope_orf
Parâmetro: \(\text{slope}_{i}^{[RF]},\text{slope}_{i}^{[ORF]}\)
Distribuição a priori padrão: LogNormal(0.7, 0.4)
Justificativa:
- Moderadamente informativo para evitar a não identificação com
ec_rf
. Definida em conjunto com a distribuição a priori
ec_rf
para que a média da distribuição para frequência ideal seja 2,1 e tenha intervalo de confiança de 90% de[1, 4.4]
, que é um intervalo razoável de frequência ideal.[M]
indica um canal de mídia paga com impressões.[RF]
indica um canal de mídia paga com alcance e frequência.[OM]
indica um canal de mídia orgânica com impressões.[ORF]
indica um canal de mídia orgânica com alcance e frequência.
sigma
Parâmetro: \(\sigma_g\)
Distribuição a priori padrão: HalfNormal(5)
Justificativa:
Não informativo porque a variância residual muda muito de acordo com o anunciante.