Gráfico causal

En Suposiciones obligatorias, se explicó que la suposición de intercambiabilidad condicional se aplica si se supone un gráfico causal que cumple con el criterio de puerta trasera.

Un gráfico causal muestra la relación entre las variables. Las variables se agrupan en colecciones (nodos), y una flecha entre los nodos indica que podría existir un efecto causal en la dirección de la flecha. Una flecha no siempre indica que hay una relación causal entre cada par de variables, pero sí que no puede existir tal relación en el sentido inverso para ningún par de variables.

Según el criterio de puerta trasera (Pearl, J., 2009), dado un diagrama causal, un conjunto de variables \(Z\) satisfará el criterio de puerta trasera en relación con una variable de tratamiento \(X\) y la variable de respuesta \(Y\) si se cumplen ambas de estas condiciones:

  • Ningún nodo de \(Z\) es subordinado de \(X\).
  • \(Z\) bloquea cada ruta entre \(X\) e \(Y\) que contiene una flecha hacia \(X\).

El modelado de combinación de marketing (MMM) se usa para estimar el efecto causal de las variables de medios pagados, de medios orgánicos y que no son de medios en un KPI (como las ventas). Por lo tanto, las variables de medios pagados, de medios orgánicos y que no son de medios son las variables de tratamiento (\(X\)) y el KPI es la variable de respuesta (\(Y\)). Para estimar este efecto causal a partir de una regresión de MMM, el MMM debe condicionar un conjunto de variables de control cuidadosamente seleccionadas que cumplan con el criterio de puerta trasera. En otras palabras, estas son las condiciones del criterio de puerta trasera:

  • No debes controlar ninguna variable mediadora. Las variables mediadoras son aquellas que se encuentran en la cadena causal entre \(X\) e \(Y\).
  • Debes controlar todas las variables de confusión. Las variables de confusión son aquellas que tienen un efecto causal en \(X\) y en \(Y\).

La variable de tratamiento del MMM es una colección de cualquier combinación de variables de tratamiento de medios pagados, de medios orgánicos y que no son de medios indexadas en función de la ubicación geográfica y el tiempo. Es difícil representar todas las variables de tratamiento en un gráfico, por lo que te recomendamos que utilices un gráfico simplificado que represente solo dos períodos dentro de una sola ubicación geográfica. Se supone que las ubicaciones geográficas son independientes, por lo que se puede usar el mismo gráfico para representar cualquiera de ellas. Además, no hay flechas ni relaciones entre las ubicaciones geográficas. Dos períodos son suficientes para describir el patrón de los efectos rezagados de las variables de tratamiento, que puedes suponer que se repite de forma indefinida en el futuro (o hasta cierta duración máxima de retraso).

En el siguiente diagrama, \(T\) representa las variables de tratamiento de medios pagados, de medios orgánicos y que no son de medios; \(C\) , los controles, y \(K\) , el KPI. El número que sigue a cada variable indica el período. Dentro de cada período, se supone que las variables de tratamiento afectan las ventas y que las variables de control afectan tanto las variables de tratamiento como las ventas. En el siguiente diagrama, \(T\) de un período anterior afecta las ventas del período actual ("efecto rezagado"). El modelo de regresión de Meridian aplica la función de Adstock a las variables de tratamiento de medios pagados y orgánicos, pero no a las que no son de medios. Esto supone que las variables de tratamiento que no son de medios no tienen efectos rezagados. Incluir variables de tratamiento que no son de medios en el nodo \(T\) sigue siendo algo válido porque una flecha indica que puede existir un efecto causal entre cualquier par de variables en nodos conectados. Si incluyes variables de tratamiento que no son de medios en el nodo \(T\) , la presentación del DAG será más clara y el DAG seguirá siendo válido para determinar qué variables satisfacen el criterio de puerta trasera.

Efecto rezagado de una variable de tratamiento

Supongamos que debes estimar el efecto causal de la variable de tratamiento (\(T1\) y\(T2\)) en el KPI durante el período 2 (\(K2\)). En el gráfico, puedes ver que las variables de control del período 2 (\(C2\)) satisfacen el criterio de puerta trasera.

Las principales conclusiones son que, para cada período, la regresión del MMM se debe condicionar en función de lo siguiente:

  1. Medios pagados y orgánicos del período actual y de todos los períodos anteriores, hasta una duración máxima de retraso supuesta
  2. Variables de tratamiento que no son de medios del período actual únicamente
  3. Variables de control del período actual únicamente

Estos son algunos detalles importantes que debes tener en cuenta:

  • Una flecha de \(C1\) a \(C2\) no tiene ninguna implicación sobre qué variables se deben incluir en la regresión.
  • Una flecha de \(C1\) a \(K2\) requiere que la regresión incluya variables de control rezagadas. En la práctica, es mejor evitar esto si es posible, ya que podría aumentar significativamente la cantidad de parámetros de regresión.
  • Una flecha de \(T1\) a \(C2\) puede causar problemas. En este caso, \(C2\) actúa como variable mediadora y de confusión al mismo tiempo. No se puede usar un solo modelo de regresión de MMM para recuperar el efecto causal de la variable de tratamiento.
  • Agregar la ruta \(T2 \leftarrow K1 \rightarrow K2\) puede causar problemas por el mismo motivo. En este caso, \(K1\) actúa como variable mediadora y de confusión al mismo tiempo.