Referência de notação matemática

Este guia é uma referência da notação matemática usada no Meridian.

Ele foi criado para ajudar você a interpretar e entender as equações que estimam o impacto causal das suas variáveis de tratamento e otimizar o orçamento.

Índice


Variáveis de base e dados de entrada

Esses símbolos representam as entradas usadas nas equações do modelo do Meridian, representando dados totalmente escalonados e transformados. A letra indica a métrica, e o sobrescrito entre colchetes define o tipo ou a categoria específica de dados.

Símbolo Descrição
$y$ KPI: variável de resposta (valor desejado, dependente) do modelo. Pode ser receita, unidades de vendas, conversões ou qualquer outro valor em que as variáveis de tratamento possam ter um efeito causal.
$z^{[C]}$ Variáveis de controle: variáveis no modelo que não são de tratamento (por exemplo, clima ou preço). Eles são usados para estimar o resultado de referência.
$x^{[M]}$ Variáveis de mídia paga: nível de execução de mídia (por exemplo, cliques ou gastos) para canais de mídia paga.
$r^{[RF]}$ Alcance pago: número de usuários únicos expostos à mídia paga.
$f^{[RF]}$ Frequência paga: número de impressões pagas por espectador único.
$x^{[OM]}$ Variáveis de mídia orgânica: nível de execução de mídia (por exemplo, aberturas de newsletter) para canais de mídia orgânica.
$r^{[ORF]}$ Alcance orgânico: número de usuários únicos expostos à mídia orgânica.
$f^{[ORF]}$ Frequência orgânica: número de impressões orgânicas por espectador único.
$x^{[N]}$ Variáveis de tratamento não relacionadas à mídia: nível de execução de intervenções não relacionadas à mídia (por exemplo, promoções ou preços).
$p$ População: total de habitantes por região, usado para dimensionar os dados e permitir a comparação entre áreas pequenas e grandes.
$u$ Valores unitários: valores monetários usados para converter unidades brutas em gastos para cálculos de ROI.
  • Dados de entrada: define as estruturas de dados exatas e os requisitos de dimensão para variáveis básicas como $y$, $z^{[C]}$, and $x^{[M]}$.
  • Alcance e frequência: explica como o alcance ($r^{[RF]}$) e a frequência ($f^{[RF]}$) substituem as métricas de execução padrão para modelar a saturação com mais precisão.
  • Variáveis de mídia orgânica e de tratamento não relacionadas à mídia: detalha as diferenças entre mídia paga, mídia orgânica ($x^{[OM]}$) e tratamentos não relacionados à mídia ($x^{[N]}$), incluindo estruturas de custo e comportamentos variáveis.
  • Variáveis de controle: explica a lógica causal para selecionar confundidores ($z^{[C]}$) e reduzir o viés das estimativas.

Notação de estado e transformação de dados

Na estrutura do Meridian, as variáveis passam por uma função de transformação antes de entrar no modelo. Marcadores especiais (como pontos e adagas) indicam em qual estágio de transformação dos dados.

Símbolo Descrição Exemplo
$\ddot{(\cdot)}$ Dados de entrada brutos (dois pontos): dados em seu estado original, fornecidos pelo usuário antes de qualquer escalonamento. $\ddot{y}$ representa a contagem bruta do KPI de uma região.
$(\cdot)^\dagger$ Dimensionamento da população (adaga): estado de dados intermediários. São os dados brutos divididos pela população da região geográfica ($p_ {g}$). $y^\dagger_ {g,t} = \ddot{y}_ {g,t} / p_ {g}$
$(\cdot)$ Variável totalmente transformada: dados transformados finais usados nas equações do modelo. Para um KPI, essa é a variável de adaga centrada na média zero e dimensionada para o desvio padrão um. $y$ é o valor final de vendas que o modelo aprende.
$L(\cdot)$ Função de transformação: função de transformação linear específica aplicada para converter as unidades brutas em unidades totalmente dimensionadas.

Os detalhes específicos de cada transformação realizada no Meridian podem ser encontrados na seção Dados de entrada.
$y = L^{[Y]}(\ddot{y})$
  • Dados de entrada: contém as funções de escalonamento linear exatas $L(\cdot)$ aplicadas a cada tipo de variável para converter entradas brutas em unidades totalmente dimensionadas.
  • Especificação do modelo: mostra como as variáveis totalmente escalonadas são usadas na equação de regressão.

Variáveis de índice (subscritos)

Os índices são as "coordenadas" das matrizes de dados e informam exatamente qual fatia de dados está sendo referenciada. O Meridian associa subscritos às variáveis de base para especificar dimensões como região geográfica e tempo (por exemplo, $x^{[M]}_ {g,t,i}$).

Símbolo Descrição Exemplo
$g$ Geografia: indexa unidades geográficas específicas ($1, \dots, G$). $g$ = Nova York ou Londres.
$t$ Tempo: indexa períodos específicos ($1, \dots, T$). $t$ = 10ª semana do período usado para treinar a MMM.
$i$ Índice de variável: um índice universal usado para especificar um canal ou tratamento específico em uma categoria. $i = 3$ corresponde ao terceiro canal de mídia paga.
$G$ Total de regiões geográficas: número total de unidades geográficas. $G = 50$ para um modelo no nível de um estado dos EUA.
$T$ Total de períodos: número total de períodos. $T = 104$ para dois anos de dados semanais.
$N_ {C}$ Total de controles: número total de variáveis de controle. $N_ {C} = 3$ (por exemplo, preço, clima e feriados).
$N_ {M}$ Total de mídia paga: número total de variáveis de mídia paga sem alcance e frequência $N_ {M} = 4$ (por exemplo, TV, rádio, mídia impressa e pesquisa).
$N_ {RF}$ Total de alcance e frequência pagos: número total de variáveis de mídia paga com alcance e frequência. $N_ {RF} = 2$ (por exemplo, Facebook e YouTube).
$N_ {OM}$ Total de mídia orgânica: número total de variáveis de mídia orgânica sem alcance e frequência. $N_ {OM} = 2$ (por exemplo, SEO e posts em redes sociais).
$N_ {ORF}$ Total de alcance e frequência orgânicos: número total de variáveis de mídia orgânica com alcance e frequência. $N_ {ORF} = 1$ (por exemplo, newsletter orgânica).
$N_ {N}$ Total de tratamentos não relacionados à mídia: número total de variáveis de tratamento não relacionadas à mídia. $N_ {N} = 2$ (por exemplo, promoções na loja e cupons).
  • Modelagem geográfica: apresenta as vantagens estatísticas de indexar dados por região geográfica ($g$) em vez de agregar dados nacionalmente.
  • Observações de validação: mostra como coordenadas específicas de tempo ($t$) e região geográfica ($g$) são omitidas durante o treinamento de modelo para calcular o ajuste out-of-sample.
  • Modelagem nacional: detalha as restrições de parâmetro que o Meridian aplica automaticamente ao modelar uma única região geográfica ($G=1$).

Parâmetros do modelo

Esses são os parâmetros e coeficientes "aprendidos" (representados por letras gregas) que o modelo estima com base nos dados.

Símbolo Descrição
$\theta$ Theta: termo geral para qualquer parâmetro não observável estimado pelo modelo.
$\tau_ {g}$ Tau (interceptos geográficos): efeitos geográficos, que representam o KPI médio de cada localidade em relação à referência.
$\mu_ {t}$ Mu (interceptos que variam com o tempo): efeitos temporais derivados dos valores de nó.
$b_ {k}$ Parâmetro de nó: o valor estimado para o nó $k$.
$\beta^{[M]}_ {i}, \beta^{[RF]}_ {i},$
$\beta^{[OM]}_ {i}, \beta^{[ORF]}_ {i}$
Beta (efeitos hierárquicos de mídia): parâmetro da distribuição hierárquica dos efeitos de mídia no nível geográfico. Quando a distribuição de efeitos de mídia é definida como normal, trata-se da média hierárquica. Quando definido como log-normal, é o parâmetro hierárquico da média da distribuição normal subjacente em escala logarítmica.
$\beta^{[M]}_ {g,i}, \beta^{[RF]}_ {g,i},$
$\beta^{[OM]}_ {g,i}, \beta^{[ORF]}_ {g,i}$
Beta (efeitos de mídia no nível geográfico): o coeficiente de efeito de mídia específico para um canal $i$ na região $g$, amostrado da distribuição hierárquica.
$\gamma^{[C]}_ {i}, \gamma^{[N]}_ {i}$ Gama (média de controle hierárquico): média hierárquica do coeficiente em um controle ou canal que não é de mídia. A hierarquia é definida com base em regiões geográficas.
$\sigma$ Sigma (desvio padrão residual): desvio padrão do ruído.
$\eta$ Eta (variância hierárquica de mídia): parâmetro da distribuição hierárquica de efeitos de mídia no nível geográfico. Quando a distribuição de efeitos de mídia é definida como normal, trata-se do desvio padrão hierárquico. Quando definido como log-normal, é o parâmetro hierárquico do desvio padrão da distribuição normal subjacente em escala logarítmica.
$\xi$ Xi (variância hierárquica de controle e não relacionada à mídia): o desvio padrão hierárquico do coeficiente em um controle ou canal não relacionado à mídia. A hierarquia é definida com base em regiões geográficas.
$\alpha$ Alfa (taxa de decaimento de Adstock): um valor entre 0 e 1.
$\mathtt{ec}$ Meia saturação: o "ponto de saturação" em que você atinge 50% do aumento máximo possível nas vendas.
$\mathtt{slope}$ Inclinação: controla a forma da curva de resposta. Valores do parâmetro $slope\leq1$ cria uma curva estritamente côncava, enquanto $slope > 1$ cria uma curva em S.
  • Especificação do modelo: fornece a equação de regressão completa mostrando como parâmetros não observáveis, como $\beta$, $\gamma$ e $\tau$, interagem para estimar o resultado.
  • Distribuições a priori padrão: lista as distribuições estatísticas padrão e a lógica atribuída a parâmetros aprendidos, como $\tau_g$, $\beta_i$ e $\sigma$.
  • Inferência bayesiana: explica como a amostragem de MCMC estima conjuntamente os parâmetros não observáveis ($\theta$) e a incerteza deles com base nos dados observados.

Hiperparâmetros

São parâmetros fixos definidos antes do treinamento do modelo, atuando como entradas estruturais em vez de coeficientes aprendidos.

Símbolo Descrição
$L$ Duração máxima da defasagem: hiperparâmetro fixo que representa o número máximo de semanas em que um anúncio afeta as vendas.
$K$ Total de nós: número total de nós usados para modelar o efeito temporal variável.
$s_ {k}$ Localização do nó: período específico do $k$-ésimo nó.

Parâmetros variáveis ao longo do tempo

O Meridian usa nós para modelar efeitos temporais. Em vez de estimar um efeito temporal único para cada período, o modelo define valores em pontos de ancoragem (nós) e interpola os intervalos entre eles.

Esses símbolos representam o funcionamento da notação usada para calcular essa interpolação.

Símbolo Descrição
$b_ {k}$ Parâmetro de nó: o valor estimado para o nó $k$.
$\ell(t)$ Índice de nó mais baixo: índice do nó anterior mais próximo para um determinado tempo $t$.
$u(t)$ Índice do nó superior: índice do nó seguinte mais próximo para um determinado tempo $t$.
$w(t)$ Ponderação de tempo: ponderação de interpolação do tempo $t$, calculada com base na distância entre os locais de nós vizinhos ($s_ {\ell(t)}$ e $s_ {u(t)}$).
$\mu_ {t}$ Intercepto variante no tempo: efeito temporal resultante no tempo $t$, calculado como a média ponderada: $\mu_ {t} = w(t)b_ {\ell(t)} + (1-w(t))b_ {u(t)}$.
  • Definir nós: explica como selecionar o número total de nós $K$ e encontrar o equilíbrio ideal entre viés e variância ao estimar os efeitos temporais.
  • Especificação do modelo: detalha o cálculo exato da ponderação baseada em distância $w(t)$ usada para interpolar $\mu_t$ entre as posições dos nós adjacentes.

Especificação do modelo

Para conferir a equação matemática completa que combina as entradas e os parâmetros no modelo do Meridian, consulte a página Especificação do modelo.

Condicionais e lógica

Esses símbolos representam dependências, lógica matemática ou relações estatísticas.

Símbolo Descrição Exemplo
$\mid$ Pipe: lida como "Dado que". Indica probabilidade ou expectativa condicional. $P(\theta \mid data)$ corresponde à probabilidade dos parâmetros considerando os dados observados.
$I_ {\lbrace \dots \rbrace}$ Função indicadora: uma chave lógica. Ele é igual a 1 quando a condição interna é true, e 0 caso contrário. $I_ {i}^{[C]} = 1$ se o escalonamento populacional for aplicado à variável de controle $i$, e 0 caso contrário.
$\sim$ Operador til: lê-se "é distribuído como". Associa um parâmetro à distribuição estatística a priori dele. Observação: esse operador é diferente do acento til $\overset \sim Y$ usado para indicar resultados possíveis. $\gamma^{[C]}_ {i} \sim \text{Normal}(0, 5)$ indica que o parâmetro segue uma distribuição normal com média 0 e desvio padrão 5.
$\lbrace \dots \rbrace$ Chaves: denotam um conjunto, um vetor ou uma matriz multidimensional de variáveis. ${x_ {g,t,i}}$ representa a matriz de execução de mídia observada, enquanto ${q_ {t-s}}^L_ {s=0}$ representa uma sequência de defasagem temporal.
$\forall$ Para todo: quantificador universal. Isso significa que a equação ou condição se aplica a todos os valores em um conjunto específico. $\forall g,t$ indica que a condição se aplica a todas as regiões geográficas e períodos.
  • Dados de entrada: usa a notação de conjunto (${\dots}$) para definir as matrizes de variáveis de controle e tratamento necessárias para a modelagem.
  • Inferência bayesiana: explica a probabilidade condicional $P(\theta \mid dados)$ no centro da amostragem de MCMC do Meridian.
  • Premissas necessárias: detalha a premissa de permutabilidade condicional ($E(\overset \sim Y \mid z)$) necessária para estimar os efeitos causais com segurança.

Inferência causal e otimização de orçamento

Esses símbolos são usados para definir cenários contrafactuais, gerar curvas de resposta e calcular alocações de orçamento ideais.

Símbolo Descrição
$\overset \sim Y^{(\lbrace x^{(1)} \rbrace)}$ Resultado potencial: resultado hipotético (por exemplo, vendas) que ocorreria em um cenário específico. O til ($\overset \sim Y$) denota um resultado potencial, enquanto o sobrescrito ($\lbrace x^{(1)} \rbrace$) representa o cenário específico de execução de mídia em teste.
$x^{(1)}, x^{(0)}$ Cenários contrafactuais: utilizados para comparar diferentes configurações de execução de mídia. Tipicamente, $x^{(1)}$ denota a execução histórica, enquanto $x^{(0)}$ representa o cenário de referência (por exemplo, investimento nulo em um canal específico).
$b_ {i}$ Orçamento: o orçamento total alocado a um canal específico $i$ durante a otimização.
$\omega$ Fator de escalonamento do gasto: um multiplicador usado para ajustar a escala do investimento histórico. Usado matematicamente para gerar curvas de resposta ou calcular o ROI marginal.
$f^*$ Frequência desejada/ideal: frequência média ideal de anúncios determinada durante a otimização de alcance e frequência.
$(j)$ Sobrescrito da amostra de MCMC: denota uma amostra específica da simulação (uma das milhares de respostas possíveis geradas pelo modelo) usada para calcular a média a posteriori do resultado esperado.