次のインデックス変数を定義します。
- \(g=1,\ldots,G\) は地域単位をインデックスに登録します。
\(t=1,\ldots,T\) は時間単位をインデックスに登録します。
有料メディア変数とオーガニック メディア変数の場合は、期間のデータ \(t<1\) をモデルの入力データに含めて、前の期間の効果の遅延を正確にモデリングできます。 \(t<1\) のデータが指定されていない場合、 \(t=1\)より前にメディアは使用されていないとみなされます。
\(i=1,\ldots,N_C\) は、対照群変数をインデックスに登録します。
\(i=1,\ldots,N_N\) は、メディア以外の介入群をインデックスに登録します。
\(i=1,\ldots,N_M\) は、リーチとフリークエンシーのデータがない有料メディア チャネルをインデックスに登録します。
\(i=1,\ldots, N_{OM}\) は、リーチとフリークエンシーのデータがないオーガニック メディア チャネルをインデックスに登録します。
\(i=1,\ldots,N_{RF}\) は、リーチとフリークエンシーのデータがある有料メディア チャネルをインデックスに登録します。
\(i=1,\ldots, N_{ORF}\) は、リーチとフリークエンシーのデータがあるオーガニック メディア チャネルをインデックスに登録します。
メリディアンでは、モデル入力として 2 つの主要データ配列(KPI と有料メディア)が必要です。利用可能な場合は、オーガニック メディアとメディア以外の介入群もオプションの入力値として指定できます。リーチとフリークエンシーのデータが地域別や期間別に利用可能な有料メディアとオーガニック メディアのチャネルでは、単一のメディア指標の代わりに、リーチとフリークエンシーのデータを使用することも可能です。また、交絡変数または KPI の重要な予測指標である対照群を含めることもできます。加えて、KPI が収益でない場合は収益データを、メディア ユニットが費用でない場合はメディア費用データを指定することが推奨されています。これらのデータを指定することで、単位を通貨値に変換して費用対効果を計算することが可能になります。
データ | ディメンション | モデル入力: 元の単位 | モデル入力: 単位値 | 変換された単位(モデルの式で使用) | 値 / 費用 |
---|---|---|---|---|---|
KPI | $$G \times T$$ | $$\overset{\cdot \cdot}{y}_{g,t}$$ | $$u^{[Y]}_{g,t}$$ | $$y_{g,t} = L^{[Y]}_{g,t} (\overset{\cdot \cdot}{y}_{g,t})$$ | $$\overset{\sim}y_{g,t} = u^{[Y]}_{g,t} \cdot \overset{\cdot \cdot}{y}_{g,t}$$ |
対照群 | $$G \times T \times N_C$$ | $$\overset{\cdot \cdot}{z}_{g,t,i}$$ | $$\text{N/A}$$ | $$z_{g,t,i} = L^{[C]}_{g,i}(\overset{\cdot \cdot}{z}_{g,t,i})$$ | $$\text{N/A}$$ |
メディア | $$G \times T \times N_M$$ | $$\overset{\cdot \cdot}{x}^{[M]}_{g,t,i}$$ | $$u^{[M]}_{g,t,i}$$ | $$x^{[M]}_{g,t,i} = L^{[M]}_{g,i}(\overset{\cdot \cdot}{x}^{[M]}_{g,t,i})$$ | $$\overset{\sim}x_{g,t,i}^{[M]} = u^{[M]}_{g,t,i}\cdot\overset{\cdot \cdot}{x}^{[M]}_{g,t,i}$$ |
リーチ | $$G \times T \times N_{RF}$$ | $$\overset{\cdot \cdot}{r}^{[RF]}_{g,t,i}$$ | $$u^{[RF]}_{g,t,i}$$ | $$r_{g,t,i} = L^{[RF]}_{g,i}(\overset{\cdot \cdot}{r}^{[RF]}_{g,t,i})$$ | $$\overset{\sim}r^{[RF]}_{g,t,i} = u^{[RF]}_{g,t,i} \cdot \overset{\cdot \cdot}{r}^{[RF]}_{g,t,i} \cdot f^{[RF]}_{g,t,i}$$ |
フリークエンシー | $$G \times T \times N_{RF}$$ | $$f^{[RF]}_{g,t,i}$$ | $$\text{N/A}$$ | ||
オーガニック メディア | $$G \times T \times N_{OM}$$ | $$\overset{\cdot \cdot}{x}^{[OM]}_{g,t,i}$$ | $$u^{[OM]}_{g,t,i}$$ | $$x^{[OM]}_{g,t,i} = L^{[OM]}_{g,i}(\overset{\cdot \cdot}{x}^{[OM]}_{g,t,i})$$ | $$\overset{\sim}x^{[OM]}_{g,t,i} = u^{[OM]}_{g,t,i}\cdot\overset{\cdot \cdot}{x}^{[OM]}_{g,t,i}$$ |
オーガニック リーチ | $$G \times T \times N_{ORF}$$ | $$\overset{\cdot \cdot}{r}^{[ORF]}_{g,t,i}$$ | $$u^{[ORF]}_{g,t,i}$$ | $$r^{[ORF]}_{g,t,i} = L^{[ORF]}_{g,i}(\overset{\cdot \cdot}{r}^{[ORF]}_{g,t,i})$$ | $$\overset{\sim}r^{[ORF]}_{g,t,i} = u^{[ORF]}_{g,t,i} \cdot \overset{\cdot \cdot}{r}^{[ORF]}_{g,t,i} \cdot f^{[ORF]}_{g,t,i}$$ |
オーガニック フリークエンシー | $$G \times T \times N_{ORF}$$ | $$f^{[ORF]}_{g,t,i}$$ | $$\text{N/A}$$ | ||
メディア以外の介入群 | $$G \times T \times N_N$$ | $$\overset{\cdot \cdot}{x}^{[N]}_{g,t,i}$$ | $$\text{N/A}$$ | $$x^{N}_{g,t,i} = L^{N}_{g,i}(\overset{\cdot \cdot}{x}^{N}_{g,t,i})$$ | $$\text{N/A}$$ |
単位変換はメリディアンによって内部で処理されます。階層モデルですべての地域を同等のスケールにするには、地域の人口をスケーリングする必要があります。その他の標準化は、各変数のスケールを考慮せずに標準化された事前分布を使用できるように行われます。
\(p_g\) を各地域の人口サイズとして定義します。これは、ユーザーが指定する必要がある別のモデル入力です。線形変換は次のようになります。
変換: KPI の単位
KPI の単位は、すべての地域をほぼ同じスケールにするために人口でスケーリングされます。これにより、モデル パラメータを人口規模に合わせてスケーリングする必要がなくなります。
人口でスケーリングされた KPI は、平均が 0、標準偏差が 1 になるように正規化されます。平均を 0 に調整すると、切片項(knot_values
と tau_g
)の中心を 0 とした事前分布を合理的に選択できます。標準偏差を 1 にスケーリングすると、合理的なデフォルトの事前分布を割り当てることができるようにパラメータがスケールに配置されます。
表記: \(L^{[Y]}_{g,t} (\cdot)\)
説明:
- 地域の人口で割ります。
- 地域でスケーリングされた値を中央に揃え、平均を 0、標準偏差を 1 にスケーリングします。
定義:
\(L^{[Y]}_{g,t} (q) = \dfrac{\dfrac{q}{p_g} - m^{[Y]}}{s^{[Y]}}\)
詳細は次のとおりです。
- \(y^\dagger_{g,t} = \dfrac{\overset {\cdot \cdot} y_{g,t}}{p_g}\)
- \(m^{[Y]} = \frac{1}{GT}\sum\limits_{g,t} y^\dagger_{g,t}\)
- \(s^{[Y]} = \sqrt{\frac{1}{GT-1} \sum\limits_{g,t} \left( y^\dagger_{g,t}-m^{[Y]} \right)^2}\)
変換: 対照群変数
対照群変数を人口でスケーリングする必要があるのは、値が人口規模とほぼ同じ比率でスケーリングされる場合のみです。メリディアンには地域固有のランダム効果係数(gamma_gc
)がありますが、人口規模に応じてスケーリングされる係数を取得するには、モデル適合に依存するのではなく、変数をスケーリングすることをおすすめします。
対照群変数は、平均が 0、標準偏差が 1 になるように正規化されます。平均を 0 に調整すると、切片項(knot_values
と tau_g
)の中心を 0 とした事前分布を合理的に選択できます。標準偏差を 1 にスケーリングすると、合理的なデフォルトの無情報事前分布を割り当てることができるように係数の平均(gamma_c
)がスケールに配置されます。
表記: \(L^{[C]}_{g,i} (\cdot)\)
説明:
特定の対照群では、人口のスケーリングが有効な場合があります。これは、
control_population_scaling_id
引数を使用して処理できます。デフォルトでは、対照群は人口でスケーリングされません。各対照群変数を中央に配置し、平均 0、標準偏差 1 になるようにスケーリングします。
定義:
\(L^{[C]}_{g,i}(q) = \dfrac{\dfrac{q}{p^{I^{[C]}_i}_g} - m^{[C]}}{s^{[C]}}\)
詳細は次のとおりです。
変数に
control_population_scaling_id=True
が使用されている場合は\(I_i^{[C]} = 1\) 、それ以外の場合は \(i;0\) 。- \(z^{\dagger}_{g,t,i} = \dfrac{\overset {\cdot \cdot} z_{g,t,i}}{p_g^{I_i^{[C]}}}\)
- \(m^{[C]} = \frac{1}{GT}\sum\limits_{g,t} z^{\dagger}_{g,t,i}\)
- \(s^{[C]} = \sqrt{\frac{1}{GT-1} \sum\limits_{g,t} \left( z^{\dagger}_{g,t,i}-m^{[C]} \right)^2}\)
変換: メディアの単位
メディアの単位は、すべての地域をほぼ同じスケールにするために人口でスケーリングされます。これにより、半飽和パラメータ(ec_m
)を人口規模に合わせてスケーリングする必要がなくなります。
メディアの単位は、チャネルごとにゼロ以外の中央値でスケーリングされます。これは、ec_m
パラメータの解釈をより直感的なものにする目的で行われ、ec_m
値が 1 の場合、1 人あたりのメディア単位の中央値(ゼロ以外)で半飽和点が発生することを意味します。
表記: \(L^{[M]}_{g,i} (\cdot)\)
説明:
- 地域の人口で割ります。
- メディア チャネルごとに、ゼロ以外の中央値を使用して地域でスケーリングされた値をスケーリングします。
定義:
\(L^{[M]}_{g,i} (q) = \dfrac{q}{p_g d^{[M]}}\)
詳細は次のとおりです。
- \(x^{\dagger [M]}_{g,t,i} = \dfrac{\overset {\cdot \cdot} x_{g,t,i}^{[M]}}{p_g}\)
- \(d^{[M]} = \text{Median}\left( \left\{ x^{\dagger [M]}_{g,t,i}:x^{\dagger [M]}_{g,t,i} > 0 \right\}_{g,t} \right)\)
変換: リーチ
リーチは、すべての地域をほぼ同じスケールにするために人口でスケーリングされています。メリディアンには地域固有のランダム効果係数(beta_grf
)がありますが、人口規模に応じてスケーリングされる係数を取得するには、モデル適合に依存するのではなく、変数をスケーリングすることをおすすめします。
リーチは、チャネルごとにゼロ以外の中央値でスケーリングされます。これにより、ほとんどのデータセットでは、デフォルトの係数平均(beta_rf
)事前分布が合理的な選択肢となります。なお、係数事前分布が使用されていない限り、中央値によるスケーリングは事前分布選択に影響しません。
表記: \(L^{[RF]}_{g,i} (\cdot)\)
説明:
変換関数はメディア単位の場合と同じです。
変換: オーガニック メディアの単位
変換と根拠は、有料メディアの単位の場合と同じです。
表記: \(L^{[OM]}_{g,i} (\cdot)\)
説明:
- 地域の人口で割ります。
- オーガニック メディア チャネルごとに、ゼロ以外の中央値を使用して地域でスケーリングされた値をスケーリングします。
定義:
\(L^{[OM]}_{g,i} (q) = \dfrac{q}{p_g d^{[OM]}}\)
詳細は次のとおりです。
- \(x^{\dagger [OM]}_{g,t,i} = \dfrac{\overset {\cdot \cdot} x_{g,t,i}^{[OM]}}{p_g}\)
- \(d^{[OM]} = \text{Median}\left( \left\{ x^{\dagger [OM]}_{g,t,i}:x^{\dagger [OM]}_{g,t,i} > 0 \right\}_{g,t} \right)\)
変換: オーガニックのリーチ
変換と根拠は、有料メディアのリーチの場合と同じです。
表記: \(L^{[ORF]}_{g,i} (\cdot)\)
説明:
変換関数はオーガニック メディア ユニットの場合と同じです。
変換: メディア以外の介入群
メディア以外の介入群変数を人口でスケーリングする必要があるのは、値が人口規模とほぼ同じ比率でスケーリングされる場合のみです。メリディアンには地域固有のランダム効果係数(gamma_gn
)がありますが、人口規模に応じてスケーリングされる係数を取得するには、モデル適合に依存するのではなく、変数をスケーリングすることをおすすめします。
メディア以外の介入群変数は、平均が 0、標準偏差が 1 になるように正規化されます。平均を 0 に調整すると、切片項(knot_values
と tau_g
)の中心を 0 とした事前分布を合理的に選択できます。標準偏差を 1 にスケーリングすると、合理的なデフォルトの事前分布を割り当てることができるように係数の平均パラメータ(gamma_n
)がスケールに配置されます。なお、係数事前分布が使用されていない限り、中央値によるスケーリングは事前分布選択に影響しません。
表記: \(L^{[N]}_{g,i} (\cdot)\)
説明:
特定のメディア以外の介入群では、人口のスケーリングが有効な場合があります。これは、
non_media_population_scaling_id
引数を使用して処理できます。デフォルトでは、メディア以外の介入群は人口でスケーリングされません。メディア以外の介入群の各変数を中央に配置し、平均 0、標準偏差 1 になるようにスケーリングします。
定義:
\(L^{[N]}_{g,i}(q) = \dfrac{\dfrac{q}{p^{I^{[N]}_i}_g} - m^{[N]}}{s^{[N]}}\)
詳細は次のとおりです。
変数に
non_media_population_scaling_id=True
が使用されている場合は\(I_i^{[N]} = 1\) 、それ以外の場合は \(i;0\) 。- \(X^{\dagger [N]}_{g,t,i} = \dfrac{\overset {\cdot \cdot} x_{g,t,i}}{p_g^{I_i^{[N]}}}\)
- \(m^{[N]} = \frac{1}{GT}\sum\limits_{g,t} x^{\dagger [N]}_{g,t,i}\)
- \(s^{[N]} = \sqrt{\frac{1}{GT-1} \sum\limits_{g,t} \left( x^{\dagger [N]}_{g,t,i}-m^{[N]} \right)^2}\)