Referencia de notación matemática

En esta guía, se incluye una referencia de la notación matemática que se usa en Meridian.

Está diseñada para ayudarte a interpretar y comprender las ecuaciones que estiman el impacto causal de tus variables de tratamiento y a optimizar el presupuesto.

Índice


Variables base y datos de entrada

Estos símbolos representan las entradas que se usan en las ecuaciones del modelo de Meridian, y representan datos completamente ajustados y transformados. La letra indica la métrica, y el superíndice entre corchetes define el tipo o la categoría específicos de los datos.

Símbolo Descripción
$y$ KPI: Es la variable de respuesta (objetivo y dependiente) del modelo. Puede corresponder a los ingresos, las unidades de venta, las conversiones o cualquier otro aspecto en el que las variables de tratamiento puedan tener un efecto causal.
$z^{[C]}$ Variables de control: Son las variables del modelo que no son de tratamiento (por ejemplo, el clima o el precio). Se usan para estimar el resultado de referencia.
$x^{[M]}$ Variables de medios pagados: Es el nivel de ejecución de medios (por ejemplo, clics o inversión) para los canales de medios pagados.
$r^{[RF]}$ Alcance pagado: Es la cantidad de personas únicas expuestas a los medios pagados.
$f^{[RF]}$ Frecuencia pagada: Es la cantidad de impresiones pagadas por usuario único.
$x^{[OM]}$ Variables de medios orgánicos: Es el nivel de ejecución de medios (por ejemplo, aperturas de boletines informativos) para los canales de medios orgánicos.
$r^{[ORF]}$ Alcance orgánico: Es la cantidad de personas únicas expuestas a los medios orgánicos.
$f^{[ORF]}$ Frecuencia orgánica: Es la cantidad de impresiones orgánicas por usuario único.
$x^{[N]}$ Variables de tratamiento no relacionadas con los medios: Es el nivel de ejecución de las intervenciones no relacionadas con los medios (por ejemplo, promociones o precios).
$p$ Población: Es el tamaño de la población de cada ubicación geográfica, que se usa para ajustar los datos de modo que las regiones pequeñas y grandes sean comparables.
$u$ Valores de unidad: Son los valores de moneda que se usan para convertir las unidades sin procesar en inversión para los cálculos del ROI.
  • Datos de entrada: Define las estructuras de datos exactas y los requisitos de dimensiones para las variables base, como $y$, $z^{[C]}$ y $x^{[M]}$.
  • Alcance y frecuencia: Explica cómo el alcance ($r^{[RF]}$) y la frecuencia ($f^{[RF]}$) sustituyen a las métricas de ejecución estándares para modelar la saturación con mayor precisión.
  • Variables de tratamiento de medios orgánicos y que no son de medios: Detalla las diferencias entre los medios pagados, los medios orgánicos ($x^{[OM]}$) y los tratamientos que no son de medios ($x^{[N]}$), incluidas las estructuras de costos y los comportamientos de las variables.
  • Variables de control: Explica la justificación causal para seleccionar factores de confusión ($z^{[C]}$) y reducir el sesgo de tus estimaciones.

Notación de estado y transformación de datos

En el framework de Meridian, las variables pasan por una función de transformación antes de ingresar al modelo. Los marcadores especiales (como puntos y dagas) indican en qué etapa de la transformación se encuentran los datos.

Símbolo Descripción Ejemplo
$\ddot{(\cdot)}$ Datos de entrada sin procesar (doble punto): Son los datos "sin modificaciones" que proporciona el usuario antes de que se produzca cualquier ajuste. $\ddot{y}$ representa el recuento del KPI sin procesar para una región.
$(\cdot)^\dagger$ Datos de población ajustados (daga): Es el estado de los datos intermedios. Son los datos sin procesar divididos por la población de la ubicación geográfica ($p_ {g}$). $y^\dagger_ {g,t} = \ddot{y}_ {g,t} / p_ {g}$
$(\cdot)$ Variable completamente transformada: Son los datos transformados finales que se usan en las ecuaciones del modelo. Para un KPI, esta es la variable de daga centrada en una media de cero y ajustada a una desviación estándar de uno. $y$ es el valor de ventas final del que aprende el modelo.
$L(\cdot)$ Función de transformación: Es la función de transformación lineal específica que se aplica para convertir las unidades sin procesar en las unidades completamente ajustadas.

En la sección Datos de entrada, puedes encontrar detalles específicos sobre cada transformación que se realiza en Meridian.
$y = L^{[Y]}(\ddot{y})$
  • Datos de entrada: Contiene las funciones de ajuste lineal exactas $L(\cdot)$ que se aplican a cada tipo de variable para convertir las entradas sin procesar en unidades completamente ajustadas.
  • Especificación del modelo: Muestra cómo se usan, en última instancia, las variables completamente ajustadas en la ecuación de regresión.

Variables de índice (subíndices)

Los índices son las "coordenadas" de los arrays de datos, que te indican exactamente a qué segmento de datos se hace referencia. Meridian agrega subíndices a las variables base para especificar dimensiones como la ubicación geográfica y el tiempo (por ejemplo, $x^{[M]}_ {g,t,i}$).

Símbolo Descripción Ejemplo
$g$ Ubicación geográfica: Indexa unidades geográficas específicas ($1, \dots, G$). $g$ = Nueva York o Londres.
$t$ Tiempo: Indexa períodos específicos ($1, \dots, T$). $t$ = Semana 10 del período que se usó para entrenar el MMM.
$i$ Índice de variable: Es un índice universal que se usa para especificar un canal o tratamiento en particular dentro de una categoría. $i = 3$ hace referencia al 3ᵉʳ canal de medios pagados.
$G$ Total de ubicaciones geográficas: Es la cantidad total de unidades geográficas. $G = 50$ para un modelo a nivel estatal de EE.UU.
$T$ Total de períodos: Es la cantidad total de períodos. $T = 104$ para dos años de datos semanales.
$N_ {C}$ Total de controles: Es la cantidad total de variables de control. $N_ {C} = 3$ (por ejemplo, precio, clima, días festivos).
$N_ {M}$ Total de medios pagados: Es la cantidad total de variables de medios pagados sin alcance y frecuencia. $N_ {M} = 4$ (por ejemplo, TV, radio, medios impresos y Búsqueda).
$N_ {RF}$ Total de medios pagados con alcance y frecuencia: Es la cantidad total de variables de medios pagados con alcance y frecuencia. $N_ {RF} = 2$ (por ejemplo, Facebook y YouTube).
$N_ {OM}$ Total de medios orgánicos: Es la cantidad total de variables de medios orgánicos sin alcance y frecuencia. $N_ {OM} = 2$ (por ejemplo, SEO, publicaciones de redes sociales).
$N_ {ORF}$ Total de medios orgánicos con alcance y frecuencia Es la cantidad total de variables de medios orgánicos con alcance y frecuencia. $N_ {ORF} = 1$ (por ejemplo, boletín informativo orgánico).
$N_ {N}$ Total de tratamientos que no son de medios: Es la cantidad total de variables de tratamiento que no son de medios. $N_ {N} = 2$ (por ejemplo, promociones en tienda, cupones).
  • Modelado a nivel geográfico: Analiza las ventajas estadísticas de indexar los datos por ubicación geográfica ($g$) en comparación con los agregarlos a nivel nacional.
  • Observaciones de datos de exclusión: Muestra cómo se excluyen las coordenadas de tiempo ($t$) y ubicación geográfica ($g$) específicas durante el entrenamiento de modelos para calcular el ajuste fuera de la muestra.
  • Modelado a nivel nacional: Detalla las restricciones de parámetros que Meridian aplica automáticamente cuando modela una sola ubicación geográfica ($G=1$).

Parámetros del modelo

Estos son los parámetros y coeficientes "aprendidos" (denotados con letras griegas) que el modelo estima a partir de los datos.

Símbolo Descripción
$\theta$ Theta: Es un término general para cualquier parámetro no observable que el modelo esté estimando.
$\tau_ {g}$ Tau (intercepciones geográficas): Son los efectos geográficos, que representan el KPI promedio de cada ubicación geográfica en relación con la ubicación geográfica de referencia.
$\mu_ {t}$ Mu (interceptos que varían con el tiempo): Son los efectos temporales derivados de los valores de los nudos.
$b_ {k}$ Parámetro de nudo: Es el valor estimado del nudo en el nudo $k$.
$\beta^{[M]}_ {i}, \beta^{[RF]}_ {i},$
$\beta^{[OM]}_ {i}, \beta^{[ORF]}_ {i}$
Beta (efectos jerárquicos de los medios): Es un parámetro para la distribución jerárquica de los efectos de los medios a nivel geográfico. Cuando la distribución de los efectos de los medios se establece como normal, es la media jerárquica. Cuando se establece en log-normal, es el parámetro jerárquico para la media de la distribución normal subyacente transformada en logaritmos.
$\beta^{[M]}_ {g,i}, \beta^{[RF]}_ {g,i},$
$\beta^{[OM]}_ {g,i}, \beta^{[ORF]}_ {g,i}$
Beta (efectos de los medios a nivel geográfico): Es el coeficiente específico del efecto de los medios para un canal $i$ dentro de la ubicación geográfica $g$, que se extrae de la distribución jerárquica.
$\gamma^{[C]}_ {i}, \gamma^{[N]}_ {i}$ Gamma (media jerárquica de la variable de control): Es la media jerárquica del coeficiente de una variable de control o un canal que no es de medios. La jerarquía se define en función de las ubicaciones geográficas.
$\sigma$ Sigma (desviación estándar residual): Es la desviación estándar del ruido.
$\eta$ Eta (varianza jerárquica de los medios): Es un parámetro para la distribución jerárquica de los efectos de los medios a nivel geográfico. Cuando la distribución de los efectos de los medios se establece como normal, es la desviación estándar jerárquica. Cuando se establece en log-normal, es el parámetro jerárquico para la desviación estándar de la distribución normal subyacente transformada en logaritmos.
$\xi$ Xi (varianza jerárquica de control y que no es de medios): Es la desviación estándar jerárquica del coeficiente de una variable de control o un canal que no es de medios. La jerarquía se define en función de las ubicaciones geográficas.
$\alpha$ Alfa (tasa de decaimiento de Adstock): Es un valor entre 0 y 1.
$\mathtt{ec}$ Punto de semisaturación: Es el "punto de saturación" en el que alcanzas el 50% del aumento máximo posible en las ventas.
$\mathtt{slope}$ Pendiente: Controla la forma de la curva de respuesta. $slope\leq1$ crea una curva estrictamente cóncava; $slope > 1$ crea una "curva en S".
  • Especificación del modelo: Proporciona la ecuación de regresión completa que muestra cómo interactúan los parámetros no observables, como $\beta$, $\gamma$ y $\tau$, para estimar el resultado.
  • Distribuciones a priori predeterminadas: Enumera las distribuciones estadísticas predeterminadas y la justificación asignada a los parámetros aprendidos, como $\tau_g$, $\beta_i$ y $\sigma$.
  • Inferencia bayesiana: Explica cómo el muestreo de MCMC estima de forma conjunta estos parámetros no observables ($\theta$) y su incertidumbre a partir de los datos observados.

Hiperparámetros

Son parámetros fijos que se establecen antes de entrenar el modelo y actúan como entradas estructurales en lugar de coeficientes aprendidos.

Símbolo Descripción
$L$ Duración máxima del rezago: Es un hiperparámetro fijo que representa la cantidad máxima de semanas que se supone que un anuncio afecta las ventas.
$K$ Nudos totales: Es la cantidad total de nudos que se usan para modelar el efecto del tiempo que varía con el tiempo.
$s_ {k}$ Ubicación del nudo: Es el período específico en el que se encuentra el nudo $k$-th.

Parámetros que varían con el tiempo

Meridian usa nudos para modelar los efectos temporales. En lugar de estimar un efecto temporal único para cada período, el modelo estima valores en puntos de anclaje específicos (nudos) y, luego, interpola los valores para los períodos intermedios.

Estos símbolos representan los mecanismos de notación que se usan para calcular esa interpolación.

Símbolo Descripción
$b_ {k}$ Parámetro de nudo: Es el valor estimado del nudo en el nudo $k$.
$\ell(t)$ Índice de nudo inferior: Es el índice del nudo anterior más cercano para un período determinado $t$.
$u(t)$ Índice de nudo superior: Es el índice del nudo siguiente más cercano para un período determinado $t$.
$w(t)$ Peso temporal: Es el peso de interpolación para el tiempo $t$, que se calcula en función de su distancia entre las ubicaciones de los nudos adyacentes ($s_ {\ell(t)}$ y $s_ {u(t)}$).
$\mu_ {t}$ Intercepto que varía con el tiempo: Es el efecto temporal resultante para el período $t$, calculado como el promedio ponderado: $\mu_ {t} = w(t)b_ {\ell(t)} + (1-w(t))b_ {u(t)}$.
  • Establece nudos: Explica cómo seleccionar la cantidad total de nudos $K$ y equilibrar la compensación entre sesgo y varianza para estimar los efectos del tiempo.
  • Especificación del modelo: Detalla el cálculo exacto del peso basado en la distancia $w(t)$ que se usa para interpolar $\mu_t$ entre ubicaciones de nudos adyacentes.

Especificación del modelo

Para conocer la ecuación matemática completa que combina estas entradas y parámetros en el modelo Meridian, consulta la página Especificación del modelo.

Condicionales y lógica

Estos símbolos representan dependencias, lógica matemática o relaciones estadísticas.

Símbolo Descripción Ejemplo
$\mid$ La barra vertical: Se lee como "Dado que". Indica la probabilidad o la expectativa condicional. $P(\theta \mid data)$ significa la probabilidad de los parámetros dados los datos observados.
$I_ {\lbrace \dots \rbrace}$ Función indicadora: Es un interruptor lógico. Es igual a 1 si la condición interna es true y 0 en caso contrario. $I_ {i}^{[C]} = 1$ si se usa el ajuste según la población para la variable de control $i$, y 0 en caso contrario.
$\sim$ Operador de virgulilla: Se lee como "se distribuye como". Vincula un parámetro a su distribución a priori estadística. (Nota: Este operador es distinto del acento ortográfico $\overset \sim Y$ que se usa para denotar resultados potenciales). $\gamma^{[C]}_ {i} \sim \text{Normal}(0, 5)$ significa que el parámetro sigue una distribución normal con una media de 0 y una desviación estándar de 5.
$\lbrace \dots \rbrace$ Llaves: Denotan un conjunto, un vector o un array multidimensional de variables. ${x_ {g,t,i}}$ representa todo el array de la ejecución de medios observada, y ${q_ {t-s}}^L_ {s=0}$ representa una secuencia durante un lapso de tiempo.
$\forall$ Para todo: Es el cuantificador universal. Esto significa que la ecuación o la condición se aplican a cada valor de un conjunto específico. $\forall g,t$ significa que la condición se aplica a todas las regiones geográficas y a todos los períodos.
  • Datos de entrada: Usa la notación de conjuntos (${\dots}$) para definir los arrays completos de las variables de control y de tratamiento que se requieren para el modelado.
  • Inferencia bayesiana: Explica la probabilidad condicional $P(\theta \mid data)$ que es la base del muestreo de MCMC de Meridian.
  • Suposiciones obligatorias: Detallan las suposiciones de intercambiabilidad condicional ($E(\overset \sim Y \mid z)$) necesarias para estimar de forma segura los efectos causales.

Inferencia causal y optimización del presupuesto

Estos símbolos se usan para definir situaciones contrafácticas, generar curvas de respuesta y calcular asignaciones de presupuesto óptimas.

Símbolo Descripción
$\overset \sim Y^{(\lbrace x^{(1)} \rbrace)}$ Resultado potencial: Es el resultado hipotético (p. ej., ventas) que se produciría en una situación específica. La virgulilla ($\overset \sim Y$) indica que se trata de un resultado potencial, y el superíndice ($\lbrace x^{(1)} \rbrace$) indica la situación específica de ejecución de medios que se está probando.
$x^{(1)}, x^{(0)}$ Situaciones contrafácticas: Se usan para comparar diferentes realidades de la ejecución de medios. Por lo general, $x^{(1)}$ representa la ejecución histórica y $x^{(0)}$ representa un valor de referencia (p. ej., inversión nula en un canal específico).
$b_ {i}$ Presupuesto: Es el presupuesto total asignado a un canal específico $i$ durante la optimización del presupuesto.
$\omega$ Factor de ajuste de la inversión: Es un multiplicador que se usa para ajustar la inversión histórica hacia arriba o hacia abajo. Se usa matemáticamente para generar curvas de respuesta o calcular el ROI marginal.
$f^*$ Frecuencia objetivo/óptima: Es la frecuencia promedio óptima de los anuncios que se resuelve durante la optimización del alcance y la frecuencia.
$(j)$ Superíndice de extracción de MCMC: Denota una "extracción" de simulación específica (una de las miles de respuestas posibles que genera el modelo) que se usa para calcular la media de la distribución a posteriori del resultado esperado.