Distribuições a priori padrão

Nesta seção, descrevemos as distribuições a priori padrão para o modelo do Meridian. Todas elas são especificadas pelo argumento prior_distribution, que aceita um objeto PriorDistribution. Cada parâmetro tem o próprio argumento no construtor PriorDistribution, e a distribuição a priori conjunta pressupõe que todas as distribuições são independentes.

Elas podem ser especificadas como um vetor (por exemplo, tfp.distributions.Normal([1, 2, 3], [1, 1, 2])) ou como um escalar (por exemplo, tfp.distributions.Normal(1, 2)). Todas as distribuições escalares são transmitidas para o comprimento do vetor de parâmetro que representam.

knot_values

Parâmetro: \(b_k\)

Distribuição a priori padrão: Normal(0, 5)

Densidade de probabilidade para a distribuição normal com média=0 e escala=5

Justificativa:

  • Distribuição a priori não informativa que determina quanto tempo um efeito pode ter.
  • Não informativa, caso você queira permitir que o tempo tenha um efeito mais significativo.
  • O aprendizado pode acontecer com dados que recebem várias regiões por período e também vários períodos por nó, quando o número de nós é baixo.

tau_g_excl_baseline

Parâmetro: \(\tau_g\)

Distribuição a priori padrão: Normal(0, 5)

Densidade de probabilidade para a distribuição normal com média=0 e escala=5

Justificativa:

  • Distribuição a priori não informativa que determina diferenças geográficas.
  • Não informativa, caso você queira permitir que as regiões geográficas tenham um efeito mais significativo.
  • O aprendizado pode acontecer com dados que recebem vários períodos por regiões.

roi_m e roi_rf

Parâmetro: \(\text{ROI}_i^{[M]},\text{ROI}_{i}^{[RF]}\)

Distribuição a priori padrão: LogNormal(0.2, 0.9)

Densidade de probabilidade para a distribuição log-normal

Justificativa:

  • Essa distribuição indica que, a priori, o ROI da média de cada canal é 1,83, 50% dos ROIs são maiores que 1,22, 80% estão entre 0,5 e 6,0, 95% estão entre 0,25 e 9,0 e 99% são menores que 10,0.
  • Se o KPI não for a receita e os dados de receita por KPI estiverem indisponíveis, uma distribuição a priori de ROI será colocada em todos os canais. Assim, a proporção do KPI que é incremental devido a todos os canais de mídia paga tem uma média a priori de 40% e um desvio padrão de 20% (chamada de "distribuição a priori da contribuição total de mídia paga"). Para mais considerações sobre esse padrão, consulte Distribuição a priori padrão da contribuição total de mídia paga.
  • A distribuição padrão é estritamente positiva, o que é necessário quando os efeitos aleatórios do coeficiente de mídia são log-normal (media_effects_dist='log_normal'). Uma distribuição a priori que permite valores negativos pode ser usada quando os efeitos aleatórios são media_effects_dist='normal', mas isso geralmente não é recomendado, porque pode inflar a variância a posteriori e causar problemas de convergência de amostragem MCMC.

mroi_m e mroi_rf

Parâmetro: \(\text{mROI}_i^{[M]},\text{mROI}_{i}^{[RF]}\)

Distribuição a priori padrão: LogNormal(0.0, 0.5)

Densidade de probabilidade para a distribuição log-normal de mROI

Justificativa:

  • Essa distribuição indica que, a priori, o mROI médio de cada canal é 1,13, 50% dos mROIs são maiores que 1,0, 80% estão entre 0,53 e 1,90, 95% estão entre 0,33 e 2,66 e 99% são menores que 3,20.
  • Por padrão, cada canal recebe a mesma distribuição a priori de mROI.
  • Se o KPI não for receita e os dados de receita por KPI estiverem indisponíveis, o mROI anterior ainda poderá ser usado, mas você precisará especificar uma distribuição personalizada para roi_m e roi_rf. Nesse caso, o mROI é interpretado como unidades de KPI incrementais por unidade de gasto (atribuído a um pequeno aumento no gasto).

contribution_m, contribution_rf, contribution_om e contribution_orf

Parâmetro: \(\text{Contribution}_i^{[M]},\text{Contribution}_{i}^{[RF]}\), \(\text{Contribution}_i^{[OM]},\text{Contribution}_{i}^{[ORF]}\)

Distribuição a priori padrão: Beta(1.0, 99.0)

Densidade de probabilidade para a distribuição a priori da contribuição

Justificativa:

  • A distribuição a priori padrão indica que, a priori, a contribuição média de cada canal é de 1%, 50% dos valores de contribuição são maiores que 0,7%, 80% estão entre 0,1% e 2,3%, 95% estão entre 0,03% e 3,7% e 99% são menores que 4,5%.
  • A distribuição padrão não permite que a contribuição de qualquer canal individual exceda 1,0 (100% do resultado observado). No entanto, isso não impede, necessariamente, que a contribuição combinada de vários canais ultrapasse 100%.
  • A distribuição padrão é estritamente positiva, o que é necessário quando os efeitos aleatórios do coeficiente de mídia são log-normal (media_effects_dist='log_normal'). Uma distribuição a priori que permite valores negativos pode ser usada quando os efeitos aleatórios são media_effects_dist='normal', mas isso geralmente não é recomendado, porque pode inflar a variância a posteriori e causar problemas de convergência de amostragem MCMC.
  • A distribuição padrão está bastante regularizada para mitigar a convergência de MCMC e problemas de valor de referência negativo. Defina uma distribuição a priori personalizada que seja adequada para seu caso de uso.

contribution_n

Parâmetro: \(\text{Contribution}_i^{[N]}\)

Distribuição a priori padrão: TruncatedNormal(0.0, 0.1, -1.0, 1.0)

Densidade de probabilidade para a distribuição a priori da contribuição

Justificativa:

  • A distribuição a priori padrão indica que, a priori, a contribuição média e mediana de cada canal é de 0% do total de resultados observados, 80% estão entre -12,8% e +12,8%, 95% estão entre -19,6% e +19,6% e 99% estão entre -25,8% e +25,8%.
  • A distribuição a priori padrão permite valores negativos porque as variáveis não relacionadas à mídia podem ter uma contribuição negativa ou positiva, dependendo do tratamento e do valor de referência correspondente do tratamento. Se você já souber que a contribuição de uma variável específica é estritamente positiva ou negativa, isso deverá ser incorporado à distribuição a priori.

beta_m, beta_rf, beta_om e beta_orf

Parâmetro: \(\beta_i^{[M]},\beta_{i}^{[RF]},\beta_{i}^{[OM]}, \beta_{i}^{[ORF]}\)

Distribuição a priori padrão: HalfNormal(5)

Densidade de probabilidade para a distribuição seminormal com escala=5

Justificativa:

  • Distribuição a priori não informativa no parâmetro para a distribuição hierárquica de efeitos de mídia no nível geográfico para canais de mídia orgânica para canais de mídia paga de impressão e alcance e frequência, respectivamente (beta_gom; beta_gorf). Quando media_effects_dist é definido como 'normal', trata-se da média hierárquica. Quando media_effects_dist é definido como 'log_normal', ele representa o parâmetro hierárquico para a média da distribuição Normal, que passou a usar transformação logarítmica.
  • Distribuição a priori não informativa no parâmetro para a distribuição hierárquica de efeitos de mídia no nível geográfico para canais de mídia paga de impressão e alcance e frequência, respectivamente (beta_gm; beta_grf). Quando media_effects_dist é definido como 'normal', trata-se da média hierárquica. Quando media_effects_dist é definido como 'log_normal', ele representa o parâmetro hierárquico para a média da distribuição Normal, que passou a usar transformação logarítmica.
  • Não informativa, porque a interpretação de beta_m, beta_rf, beta_om e beta_orf pode variar bastante de acordo com transformações, dimensionamento e tipo de execução de mídia.
  • Por padrão, o Meridian usa distribuições a priori de ROI (roi_m e roi_rf) para canais de mídia paga. Para usar distribuições a priori beta_m e beta_rf com mídia paga, defina media_prior_type='coefficient' e rf_prior_type='coefficient'.
  • Por padrão, o Meridian usa distribuições a priori de contribuição com canais de mídia orgânica (contribution_om e contribution_orf). Para usar distribuições a priori de beta_om e beta_orf com mídia orgânica, defina organic_media_prior_type='coefficient' e organic_rf_prior_type='coefficient'.

    • [M] indica um canal de mídia paga com impressões.
    • [RF] indica um canal de mídia paga com alcance e frequência.
    • [OM] indica um canal de mídia orgânica com impressões.
    • [ORF] indica um canal de mídia orgânica com alcance e frequência.

eta_m, eta_rf, eta_om e eta_orf

Parâmetro: \(\eta_i^{[M]},\eta_{i}^{[RF]},\eta_{i}^{[OM]}, \eta_{i}^{[ORF]}\)

Distribuição a priori padrão: HalfNormal(1)

Densidade de probabilidade para a distribuição seminormal com escala=1

Justificativa:

A regularização moderada incentiva pooling nas regiões. Isso gera estimativas de variância mais baixas, mas aumenta a viés e permite que o modelo use os dados com mais eficiência.

gamma_c e gamma_n

Parâmetro: \(\gamma_i^{[C]},\gamma_i^{[N]}\)

Distribuição a priori padrão: Normal(0, 5)

Densidade de probabilidade para a distribuição normal com média=0 e escala=5

Justificativa:

  • Não informativa devido à grande quantidade de variáveis de controle ou de tratamento não relacionadas à mídia.
  • Por padrão, o Meridian usa distribuições a priori de contribuição (contribution_n) com canais de tratamento que não são de mídia. Para usar distribuições a priori gamma_n com tratamentos não relacionados à mídia, defina non_media_treatments_prior_type='coefficient'.

xi_c e xi_n

Parâmetro: \(\xi_i^{[C]},\xi_i^{[N]}\)

Distribuição a priori padrão: HalfNormal(5)

Densidade de probabilidade para a distribuição seminormal com escala=5

Justificativa:

  • Não informativa para permitir um grande intervalo de variação geográfica nos efeitos das variáveis de controle e de tratamento não relacionadas à mídia.
  • Por padrão, o pooling é mais fraco para efeitos de controle e de tratamento não relacionados à mídia do que para efeitos de mídia porque os efeitos de controle são lineares e simples (sem a complexidade das transformações de Hill e Adstock).

alpha_m, alpha_rf, alpha_om e alpha_orf

Parâmetro: \(\alpha_i^{[M]},\alpha_{i}^{[RF]},\alpha_{i}^{[OM]}, \alpha_{i}^{[ORF]}\)

Distribuição a priori padrão: Uniform(0, 1)

Densidade de probabilidade para a distribuição uniforme padrão

Justificativa: não informativo para que os dados mostrem a taxa de decaimento.

ec_m e ec_om

Parâmetro: \(ec_i^{[M]}, ec_{i}^{[OM]}\)

Distribuição a priori padrão: TruncatedNormal(0.8, 0.8, 0.1, 10). Essa é a distribuição condicional \(X|0.1 < X < 10\), em que \(X \sim N(0.8,0.8)\).

Densidade de probabilidade para uma distribuição normal truncada

Justificativa:

  • Os dados são dimensionados para que, quando \(ec=1\), a meia saturação ocorra na mediana das unidades médias não nulas per capita em todas as regiões e períodos.\(ec=X\) significa que a meia saturação acontecerá em \(X\) vezes a mediana das unidades médias não nulas per capita em todas as regiões e períodos.
  • A média dessa distribuição a priori é próxima de um, o que é uma premissa razoável de onde acontece a meia saturação.
  • O truncamento é feito para manter o parâmetro dentro de um intervalo razoável para a identificação.
  • Se um canal estiver muito subsaturado (\(ec > 10\)) ou muito saturado (\(ec < 0.1\)), os dados não terão informações sobre o ponto de meia saturação. Nesses casos, o parâmetro ec_m determina o formato da curva de resposta, mas não deve ser interpretado como uma estimativa precisa de meia saturação.

ec_rf e ec_orf

Parâmetro: \(ec_{i}^{[RF]},ec_{i}^{[ORF]}\)

Distribuição a priori padrão: LogNormal(0.7, 0.4) + 1

Densidade de probabilidade para uma distribuição log-normal transformada

# Tensorflow Probability Syntax
tfp.distributions.TransformedDistribution(
    tfp.distributions.LogNormal(0.7, 0.4),
    tfp.bijectors.Shift(0.1)
)

Justificativa:

  • Moderadamente informativo para evitar a não identificação com slope_rf.
  • Definido em conjunto com a distribuição a priori slope_rf para que a média da distribuição para frequência ideal seja 2,1 e tenha intervalo de confiança de 90% de [1.0, 4.4], que é considerado um intervalo razoável de frequência ideal.

slope_m e slope_om

Parâmetro: \(\text{slope}_i^{[M]},\text{slope}_{i}^{[OM]}\)

Distribuição a priori padrão: Deterministic(1)

Justificativa:

  • Aprendizado difícil por causa dos motivos de identificação.
  • Deterministic(1) significa restrição às curvas côncavas de Hill.
  • O algoritmo de otimização do orçamento produz um valor global ideal quando as curvas de Hill são côncavas. Mudar essa distribuição a priori pode levar a curvas de Hill não côncavas e é possível que a otimização do orçamento não produza mais um valor global ideal.

slope_rf e slope_orf

Parâmetro: \(\text{slope}_{i}^{[RF]},\text{slope}_{i}^{[ORF]}\)

Distribuição a priori padrão: LogNormal(0.7, 0.4)

Densidade de probabilidade para uma distribuição log-normal

Justificativa:

  • Moderadamente informativo para evitar a não identificação com ec_rf.
  • Definida em conjunto com a distribuição a priori ec_rf para que a média da distribuição para frequência ideal seja 2,1 e tenha intervalo de confiança de 90% de [1, 4.4], que é um intervalo razoável de frequência ideal.

    • [M] indica um canal de mídia paga com impressões.
    • [RF] indica um canal de mídia paga com alcance e frequência.
    • [OM] indica um canal de mídia orgânica com impressões.
    • [ORF] indica um canal de mídia orgânica com alcance e frequência.

sigma

Parâmetro: \(\sigma_g\)

Distribuição a priori padrão: HalfNormal(5)

Densidade de probabilidade para a distribuição seminormal com escala=5

Justificativa:

Não informativo porque a variância residual muda muito de acordo com o anunciante.