このセクションには、必要なデータ量を把握するための情報をまとめています。正確なデータ量はデータの内容によって異なるため、このガイダンスは大まかな方向性を示すものです。これを評価する最も正確な方法は、モデルを実行して信頼区間の幅を評価する方法です。
データサイズは、地域の数に時点の数を掛けたものです。
これらの時点と地域は独立していません。たとえば、マーケティング ミックス モデリング(MMM)設定の 1,000 個のデータポイントは、1,000 回のコイントスや、テストでランダムに割り当てられた 1,000 人の参加者とは異なります。
全国モデルと地域モデルのセクションもご確認ください。
全国モデルのデータ量
メリディアンの全国モデルでは、効果はモデル パラメータでモデル化され、それぞれに独立した事前分布があります。全国モデルの場合、信頼性を測る重要指標は、モデル パラメータあたりのデータポイント数です。たとえば、メディア チャネルが 12 個、コントロールが 6 個、ノットが 8 個ある場合、パラメータの合計は 26 個になります(わかりやすくするため、Adstock と Hill のパラメータは無視します)。2 年間の週次データ(104 個のデータポイント)がある場合、パラメータあたりのデータポイントは 4 個になります。このサンプルサイズは、モデルを確実に推定するには小さすぎます(また、メディア費用の分散が不十分だと、全国モデルに悪影響が生じます)。ノットの詳細については、knots 引数の動作をご確認ください。
全国モデルに十分なデータを取得するのは難しいため、次のように対処します。
マーケティング ミックス モデリングの範囲を狭めます。推定対象のメディア チャネルを減らす(費用の少ないチャネルを除外するか、チャネルを統合する)、時間効果を推定するためのノット パラメータを減らす(デフォルトの
knots=1設定を使用していない場合)、不要なコントロールを削除するなどが考えられます。ただし、重要な交絡因子は削除しないでください。取得するデータを大幅に増やします。たとえば、2 年ではなく 3 年間の週次データを使用します。データ量を増やすと推論の分散は小さくなりますが、推論の関連性が低下する場合もあります。
それで、範囲を狭めたり、データを増やしたりするのではなく、データに地域の粒度を追加して地域モデルを使用する方法をおすすめです。
前述の例を使って全国モデルについて考えてみましょう。12 個のメディア チャネルを 3 つにまとめ、ノットを 2 つに減らすことができます。また、KPI の説明にはなっているものの、メディアの説明にはなっていないコントロールが見つかる場合もあります。この場合、そのコントロールは実際には交絡因子ではないため、削除しても問題ありません。3 年分の週単位データも使用する場合は、10 個のパラメータを推定するためのデータポイントは 156 個になります。パラメータあたりのデータポイントは約 15 個になるため、マーケティング ミックス モデリングから方向性に関する情報をある程度収集できるようになります。
地域モデルのデータ量
地域モデルで推定される効果あたりのデータポイント数は、信頼性を測る重要指標です。ただし、地域モデルでは、全国モデルほど簡単にモデル パラメータの数を使用して効果の数を数えることはできません。複雑さが生じるのは、地域階層が地域間で情報を共有するため、地域レベルのパラメータが独立ではなく従属関係になるためです。地域間で共有される情報の量も影響します。
たとえば、105 個の地域と 3 年間の週単位データがある場合、データポイント数は $105 \times 156 = 16,380$ となります。12 個のメディア チャネル、6 個のコントロール、100 個のノットを推定する場合、次の 2 つの観点からデータの十分性を評価できます(わかりやすくするため、Adstock と Hill のパラメータは無視します)。
- 厳密(プーリングなし)ビュー: 地域間で情報を共有しないと仮定する場合は、$(12 \times 105)+(6 \times 105)+ 100 +(105 - 1)= 2,094$ 個のパラメータを推定する必要があります(メディアとコントロールには地域レベルのパラメータがあるため、105 を掛けます)。これにより、パラメータあたり約 8 個のデータポイントが得られ、厳密な下限が示されます。
- 寛容(完全なプーリング)ビュー: 完全な情報共有(各メディア チャネルとコントロール チャネルに 1 つの共通パラメータがある)を想定すると、モデルには $12 + 6 + 100 +(105 - 1)= 222$ 個のパラメータがあります。これにより、パラメータあたり約 74 個のデータポイントが得られます。これは、EDA パッケージのパラメータに対するデータポイントの比率で使用される計算です。
各ビューでは、同じメディア パラメータとコントロール パラメータが次のようにカウントされます。
- メディア パラメータ: 厳密ビューでは $12 \times 105 = 1,260$ 個のパラメータ(独立した地域レベルのパラメータ)としてカウントされますが、寛容ビューではわずか $12$ 個のパラメータ(1 つの共通の全国レベルのパラメータ)としてカウントされます。
- コントロール パラメータ: 厳密ビュー(独立した地域レベルのパラメータ)では $6 \times 105 = 630$ 個のパラメータとしてカウントされますが、寛大ビュー(1 つの共通の全国レベルのパラメータ)ではわずか 6 個のパラメータとしてカウントされます。
各ビューは、ノットと地域パラメータを同様にカウントします。
- ノット: 各ノットに対して $100$ としてカウントされます。
- 地域パラメータ: 105 個の地域それぞれについて、ベースラインの地域を差し引いた $105 - 1 = 104$ としてカウントされます。
実際には、メリディアンは部分プーリング(階層モデリング)を使用しているため、「パラメータあたりのデータポイント」の実際の有効数は、厳密な 8 と寛大な 74 の間のどこかにあります。共有される実際の情報量は、地域間のパラメータの類似性によって決まります。これは、データと階層分散パラメータ(eta_m と xi_c)によって決まります。
階層分散パラメータ(eta_m と xi_c)を決定する唯一の方法は、実際にモデルを適合させることです。そのため、単一の「正しい」最小比率を規定することは避けています。代わりに次のように対応します。
- 厳密な計算は、潜在的な複雑さと最悪のシナリオを理解するための有用な思考演習として機能します。
- EDA パッケージでは、寛大な計算を実用的で寛大なガードレールとして使用し、完全なプーリングでもモデルが過小決定されるような、データ不足が深刻な状況を特定します。
地域レベルのモデルに十分なデータを取得するのが難しい場合は、メディア チャネルを統合するか、費用の少ないメディア チャネルを削除することをおすすめします。または、階層分散項 eta_m と xi_c に、より正規化された事前分布(HalfNormal(0.1) など)を適用することもできます。これにより、地域間で情報を共有しやすくなります。
キャンペーン単位のデータの使用について
メリディアン モデルで使用できるのはチャネルレベルのデータのみです。マーケティング ミックス モデリングはチャネルレベルで効果を発揮するマクロツールであるため、通常はキャンペーン レベルで実行することはおすすめしません。開始と終了が厳密な別個のキャンペーンを使用すると、Adstock のメモリが失われる恐れがあります。より詳細なインサイトを入手したい場合は、デジタル チャネル向けのデータドリブン マルチタッチ アトリビューションを使用することをおすすめします。