ベイズ推定

メリディアンが使用するベイズ回帰モデルは、データから学習したシグナルと事前の知識を結び付けて、メディア効果の推定と不確実性の定量化を行います。事前の知識は、事前分布を使用してモデルに取り込まれます。事前分布には、テストデータ、業界での経験、過去のメディア ミックス モデルを反映させることができます。

ベイズのマルコフ連鎖モンテカルロ(MCMC)サンプリング手法を使って、すべてのモデル係数とパラメータが同時に推定されます。これには、非線形メディア変換関数のパラメータ(Adstock や収穫逓減曲線など)も含まれます。ROI などの主なインサイトでは、点推定と信頼区間を計算する際に、すべてのパラメータとそれに対応する不確実性が考慮されます。

ベイズの定理

ベイズの定理は、観測可能なデータを使って観測不能なパラメータを推論する方法を示しています。この定理は、次の式で表せます。

$$ P(\theta|data)\ =\ \dfrac{ P(data|\theta)P(\theta) }{ \int \! P(data|\theta)P(\theta) \, \mathrm{d}\theta } $$

ここで

  • \(\theta\) は、注目すべき観測不能なパラメータ
  • \(P(\theta|data)\) は事後分布(ベイズ方程式の出力)
  • \(P(data|\theta)\) は尤度
  • \(P(\theta)\) は事前分布

事後分布について推論を行うには、尤度と事前分布を指定する必要があります。

尤度、事前分布、事後分布

尤度はモデル仕様であり、モデルのパラメータ値が\(\theta\)だと仮定した場合のデータ値の確率を指定する分布です。ベイズ分析が実施された後、パラメータ \(\theta\)について推論と推定が行われます。尤度の複雑さはさまざまです。メリディアンの尤度は、階層的回帰モデルに基づきます。メリディアンの尤度について詳しくは、モデル仕様をご確認ください。

事前分布は、データが考慮される前のパラメータの確率分布に関する信念を表します。不確実性を定量化するベイズ的アプローチでは、事前知識を組み込む必要があります。メリディアンにおいて事前分布は、マーケティング チャネルの効果に関する信念(データが観測される前の信念)を表します。情報を含む事前分布は、 \(\theta\)の確実性の高さを表します。この信念を覆すには、大量のデータによる証拠が必要です。無情報の事前分布は、 \(\theta\) の値がほとんどわからないことを表すため、ほとんど影響を与えません。メリディアン モデルは、しっかりした根拠がある事前分布とデフォルト値を提供します。ROI を調整する場合などは、事前分布をカスタマイズできます。

事後分布は、 \(\theta\) が取り得るさまざまな値に対する信念(データが考慮された後の信念)の強さを表す分布です。事後分布は、ベイズの定理に即した事前分布、データ、尤度に基づきます。データに情報がほとんどない場合、事後分布は事前分布に向かって偏ります。データに大量の情報が含まれている場合、事後分布はデータに向かって偏ります。

メリディアン モデルは、推定されるすべての指標(ROI、mROI など)だけでなく、すべてのモデル パラメータの同時事後分布と応答曲線を生成します。事後分布は、観測されたデータに基づいて更新された、マーケティング チャネルの効果に関する信念を表します。

MCMC の収束

マルコフ連鎖モンテカルロ法(MCMC)を使用すると、事後分布のサンプリングが目標分布に向かって収束します。モデルの収束は、複数の MCMC チェーンを実行し、すべてのチェーンが同じ目標分布に到達することを確かめることで評価できます。

メリディアンは、MCMC の No U-Turn Sampler(NUTS)サンプリング手法を使用します。現在の値の分布が前の反復の値に依存する確率分布から、パラメータ値が抽出されます。それらの値がチェーンを形成しますが、その過程における毎回の反復で、すべてのモデル パラメータ値がセットで更新されます。収束を評価するため、複数のチェーンが独立して実行されます。収束に達したチェーンはそれぞれが、目標の事後分布のサンプルを表します。それらのチェーンを統合すると、事後推論に使用できます。

MCMC の収束を評価するには、R-hat 値を調べることが不可欠です。R-hat 値は、モデル出力の一部として提供されます。すべてのパラメータで、1.1 未満の R-hat を取得することをおすすめします。ただし、これは厳密な基準ではありません。R-hat 値が 1.1 よりわずかに大きい場合、通常はチェーンを長めに実行することで収束に至ります。R-hat 値がとても大きい場合は(2.0 以上など)、チェーンを長めに実行することで収束が得られる可能性があります。ただし、計算時間とメモリの制約が厳しい場合は、収束を得るためにモデルを調整することが必要な場合があります。