Inferencia bayesiana

Meridian usa un modelo de regresión bayesiano, que combina el conocimiento previo con los indicadores obtenidos de los datos para estimar los efectos de los medios y cuantificar la incertidumbre. El conocimiento previo se incorpora al modelo mediante distribuciones de probabilidades a priori, que pueden basarse en datos de experimentos, experiencia en la industria o modelos de combinación de medios anteriores.

Los métodos bayesianos de muestreo de Monte Carlo basados en cadenas de Markov (MCMC) se usan para estimar de forma conjunta todos los coeficientes y parámetros del modelo. Esto incluye los parámetros de las funciones de transformación de medios no lineales, como Adstock y las curvas de retornos decrecientes. Se tienen en cuenta todos los parámetros y la incertidumbre correspondiente para calcular las estimaciones puntuales y los intervalos creíbles para el ROI y otras estadísticas clave.

Teorema de Bayes

El teorema de Bayes indica cómo puedes usar datos observables para hacer inferencias sobre parámetros no observables, lo que se puede expresar con la siguiente ecuación:

$$ P(\theta|data)\ =\ \dfrac{ P(data|\theta)P(\theta) }{ \int \! P(data|\theta)P(\theta) \, \mathrm{d}\theta } $$

Donde:

  • \(\theta\) es el parámetro de interés no observable
  • \(P(\theta|data)\) es la probabilidad a posteriori y el resultado de la ecuación bayesiana
  • \(P(data|\theta)\) es la verosimilitud
  • \(P(\theta)\) es la probabilidad a priori

Se deben especificar la verosimilitud y la probabilidad a priori para realizar la inferencia en la probabilidad a posteriori.

Verosimilitud y probabilidades a priori y a posteriori

La verosimilitud es la especificación del modelo. Es una distribución que especifica la probabilidad de los valores de los datos dados los valores del parámetro\(\theta\)del modelo. Después de realizar el análisis bayesiano, se realizan inferencias y estimaciones sobre los parámetros \(\theta\). Las verosimilitudes pueden tener diferentes niveles de complejidad. La verosimilitud de Meridian se basa en un modelo de regresión jerárquico. Para obtener más información sobre la verosimilitud de Meridian, consulta Especificación del modelo.

Una probabilidad a priori representa la creencia sobre la distribución de probabilidad de un parámetro antes de tener en cuenta los datos. En el enfoque bayesiano, es necesario incorporar conocimientos previos para cuantificar la incertidumbre. En Meridian, la distribución a priori representa las creencias sobre los efectos de los canales de marketing antes de observar los datos. Las probabilidades a priori informativas expresan un alto nivel de certeza respecto de \(\theta\), lo que requiere una gran cantidad de evidencia de datos para confirmar la creencia. Una probabilidad a priori no informativa indica que no se sabe mucho respecto de cuál puede ser el valor de \(\theta\) , por lo que esa probabilidad no tiene mucha influencia. El modelo de Meridian proporciona probabilidades a priori con valores predeterminados bien fundamentadas. Puedes personalizar las probabilidades a priori, por ejemplo, para la calibración del ROI.

La probabilidad a posteriori es una distribución que representa la certeza de la creencia en los diferentes valores posibles de \(\theta\) después de tener en cuenta los datos. Según el teorema de Bayes, la probabilidad a posteriori se basa en la probabilidad a priori, los datos y la verosimilitud. Si los datos aportan poca información, la probabilidad a posteriori tiende a ser más similar a la probabilidad a priori. Si los datos ofrecen mucha información, la probabilidad a posteriori se ajusta más en función de los datos.

El modelo de Meridian genera una distribución a posteriori conjunta para todos los parámetros del modelo, así como para cada métrica que se estima, como el ROI, el mROI y las curvas de respuesta. La distribución a posteriori representa las creencias actualizadas sobre los efectos de los canales de marketing, dados los datos observados.

Convergencia de MCMC

Con el método de Monte Carlo basado en cadenas de Markov (MCMC), el muestreo de probabilidades a posteriori converge en una distribución objetivo. Para evaluar la convergencia del modelo, se pueden ejecutar varias cadenas de MCMC y verificar que todas alcancen la misma distribución objetivo.

Meridian usa el método de muestreo No U-Turn Sampler (NUTS) de MCMC. Los valores de los parámetros se extraen de una distribución de probabilidad en la que la distribución del valor actual depende de los valores de la iteración anterior. Los valores forman una cadena, en la que cada iteración es un conjunto completo de valores de parámetros del modelo. Se ejecutan varias cadenas de forma independiente para evaluar la convergencia. Cuando se alcanza la convergencia, cada cadena representa una muestra de la distribución a posteriori objetivo. Luego, las cadenas se pueden combinar para la inferencia de la probabilidad a posteriori.

Es fundamental que examines los valores R-hat para evaluar la convergencia de MCMC. Estos valores se proporcionan como parte del resultado del modelo. Te recomendamos obtener un R-hat inferior a 1.1 para todos los parámetros, aunque este umbral no es estricto. Si los valores R-hat son ligeramente superiores a 1.1, por lo general, se puede lograr la convergencia ejecutando cadenas más largas. Si los valores R-hat son mucho más altos (p. ej., 2.0 o más), se podría obtener la convergencia ejecutando cadenas más largas. Sin embargo, el tiempo de procesamiento y las restricciones de memoria pueden ser factores prohibitivos, por lo puede ser necesario ajustar el modelo para lograr la convergencia.