O Meridian usa um modelo de regressão bayesiana, que combina conhecimentos anteriores e indicadores aprendidos com dados para estimar os efeitos de mídia e quantificar a incerteza. O conhecimento prévio é incorporado ao modelo usando distribuições a priori, que podem ser informadas por dados de experimentos, experiência do setor ou modelos de mix de mídia anteriores.
Os métodos de amostragem bayesianos de Monte Carlo via cadeias de Markov (MCMC) são usados para estimar todos os coeficientes e parâmetros do modelo. Isso inclui parâmetros das funções de transformação de mídia não lineares, como Adstock e curvas de retorno decrescentes. Todos os parâmetros e a incerteza correspondente são considerados ao calcular estimativas pontuais e intervalos de confiança para o ROI e outros insights importantes.
Teorema de Bayes
O teorema de Bayes mostra como usar dados observáveis para fazer inferências sobre parâmetros não observáveis, que podem ser expressos como a seguinte equação:
Em que:
- \(\theta\) é o parâmetro de interesse não observável
- \(P(\theta|data)\) é a distribuição a posteriori e a saída da equação Bayesiana
- \(P(data|\theta)\) é a verossimilhança
- \(P(\theta)\) é a distribuição a priori
A verossimilhança e a distribuição a priori precisam ser especificadas para realizar a inferência na distribuição a posteriori.
Verossimilhança, distribuições a priori e a posteriori
A verossimilhança é a especificação do modelo. É uma distribuição que especifica a probabilidade dos valores de dados, considerando os valores de parâmetro do modelo \(\theta\). Depois que a análise bayesiana é realizada, inferências e estimativas são feitas nos parâmetros \(\theta\). As verossimilhanças podem ter uma ampla variedade de complexidade. A verossimilhança do Meridian se baseia em um modelo de regressão hierárquica. Para mais informações sobre a verossimilhança do Meridian, consulte a Especificação do modelo.
Uma distribuição a priori representa a convicção sobre a distribuição de probabilidade de um parâmetro antes que os dados sejam considerados. A incorporação de conhecimentos prévios é necessária para a abordagem bayesiana de quantificação da incerteza. No Meridian, a distribuição a priori representa as convicções sobre os efeitos dos canais de marketing antes que os dados sejam vistos. As distribuições a priori informativas expressam uma alta certeza em \(\theta\), que exige uma grande quantidade de evidências de dados para superar a convicção. Uma distribuição a priori não informativa é uma expressão de pouca ideia do valor de \(\theta\) . Portanto, a distribuição a priori tem pouca influência. O modelo do Meridian fornece distribuições a priori bem fundamentadas com valores padrão. É possível personalizar as distribuições a priori, por exemplo, para a calibragem do ROI.
A distribuição a posteriori representa a força da convicção nos diferentes valores possíveis de \(\theta\) depois que os dados foram considerados. A distribuição a posteriori se baseia na distribuição a priori, nos dados e na verossimilhança, de acordo com o Teorema de Bayes. Se houver poucas informações nos dados, a distribuição a posteriori será mais ponderada em relação às distribuições a priori. Se houver muitas informações nos dados, a distribuição a posteriori será mais ponderada em relação a eles.
O modelo do Meridian gera a distribuição a posteriori conjunta para todos os parâmetros do modelo e todas as métricas estimadas, como ROI, mROI e curvas de resposta. A distribuição a posteriori representa as convicções atualizadas sobre os efeitos dos canais de marketing, considerando os dados observados.
Convergência de MCMC
Usando o Monte Carlo via cadeias de Markov (MCMC), a amostragem da distribuição a posteriori converge para uma distribuição de destino. Para avaliar a convergência do modelo, execute várias cadeias de MCMC e verifique se todas elas alcançam a mesma distribuição de destino.
O Meridian usa o método de amostragem No U-Turn Sampler (NUTS) do MCMC. Os valores de parâmetro são extraídos de uma distribuição de probabilidade, em que a distribuição do valor atual depende dos valores da iteração anterior. Os valores formam uma cadeia, em que cada iteração é um conjunto completo de valores de parâmetro do modelo. Várias cadeias são executadas de forma independente para avaliar a convergência. Quando ela é alcançada, cada cadeia representa uma amostra da distribuição a posteriori de destino. Então, as cadeias podem ser mescladas para inferência a posteriori.
É fundamental examinar os valores de R-hat para avaliar a convergência do MCMC. Eles são fornecidos como parte da saída do modelo. Recomendamos que você use um R-hat menor que 1,1 para todos os parâmetros, embora esse não seja um limite rígido. Se os valores de R-hat forem um pouco maiores que 1,1, a convergência geralmente poderá ser alcançada executando cadeias mais longas. Se os valores de R-hat forem muito maiores (como 2,0 ou mais), será possível obter a convergência executando cadeias mais longas. No entanto, as restrições de tempo computacional e de memória podem ser proibitivas. Então, pode ser necessário ajustar o modelo para obter a convergência.