Unter Erforderliche Annahmen wurde angegeben, dass die Annahme der bedingten Austauschbarkeit gilt, wenn Sie ein kausales Diagramm annehmen, das das Backdoor-Kriterium erfüllt.
Ein kausales Diagramm stellt die Beziehung zwischen Variablen dar. Variablen werden in Sammlungen (Knoten) gruppiert. Ein Pfeil zwischen Knoten gibt an, dass es in Pfeilrichtung eventuell einen kausalen Effekt gibt. Ein Pfeil bedeutet nicht unbedingt, dass zwischen jedem Variablenpaar ein kausaler Zusammenhang besteht. Er gibt jedoch an, dass für das entsprechende Variablenpaar kein kausaler Zusammenhang in umgekehrter Richtung bestehen kann.
Das Backdoor-Kriterium (Pearl, J., 2009) besagt, dass bei einem kausalen Diagramm eine Gruppe von Variablen \(Z\) das Backdoor-Kriterium in Bezug auf eine Testvariable \(X\) und die Antwortvariable \(Y\) erfüllt, wenn beide der folgenden Bedingungen erfüllt sind:
- Kein Knoten in \(Z\) ist ein Nachfolgerelement von \(X\)und
- \(Z\) blockiert jeden Pfad zwischen \(X\) und \(Y\) , der einen Pfeil nach \(X\)enthält.
Mithilfe von Marketing Mix Modeling (MMM) wird der kausale Effekt von kostenpflichtigen Media, organischen Media und nicht mediabezogenen Variablen auf einen KPI (z. B. den Umsatz) geschätzt. Variablen für kostenpflichtige und organische Media sowie nicht mediabezogene Variablen sind also die Testvariablen (\(X\)) und der KPI ist die Antwortvariable (\(Y\)). Um diesen kausalen Effekt aus einer MMM-Regression zu schätzen, muss beim MMM eine sorgfältig ausgewählte Gruppe von Kontrollvariablen berücksichtigt werden, die das Backdoor-Kriterium erfüllen. Die Bedingungen für das Backdoor-Kriterium:
- Sie dürfen keine Mediatorvariablen verwenden. Mediatorvariablen sind Variablen, die sich auf dem kausalen Pfad zwischen \(X\) und \(Y\)befinden.
- Sie müssen alle Störfaktoren berücksichtigen. Störfaktoren sind Variablen, die sowohl auf \(X\) als auch auf \(Y\)einen kausalen Effekt haben.
Die MMM-Testvariable ist eine Kombination aus Variablen für kostenpflichtige und organische Media sowie nicht mediabezogenen Testvariablen, die sowohl geografisch als auch zeitlich indexiert werden. Es ist schwierig, alle Testvariablen in einem Diagramm darzustellen. Aus diesem Grund betrachten wir ein vereinfachtes Diagramm, in dem nur zwei Zeiträume innerhalb einer einzelnen geografischen Einheit dargestellt werden. Geografische Einheiten werden als unabhängig angenommen. Daher kann dasselbe Diagramm für jede geografische Einheit verwendet werden und es gibt keine Pfeile oder Beziehungen zwischen diesen Einheiten. Zwei Zeiträume reichen aus, um das Muster der verzögerten Testeffekte zu beschreiben, das sich unbegrenzt in der Zukunft wiederholen wird (oder bis zu einer maximalen Verzögerungsdauer).
Im folgenden Diagramm steht \(T\) für Variablen für kostenpflichtige und organische Media sowie nicht mediabezogene Testvariablen, \(C\) für Kontrollvariablen und \(K\) für den KPI. Die Zahl nach jeder Variablen gibt den Zeitraum an. Für jeden Zeitraum wird angenommen, dass sich die Testvariablen auf den Umsatz auswirken und dass sich die Kontrollvariablen sowohl auf die Testvariablen als auch auf den Umsatz auswirken. Im folgenden Diagramm wirkt sich \(T\) aus einem früheren Zeitraum auf den Umsatz im aktuellen Zeitraum aus („verzögerter Effekt“). Beim Meridian-Regressionsmodell wird Adstock auf kostenpflichtige und organische Media angewendet, aber nicht auf nicht mediabezogene Testvariablen. Dabei wird effektiv davon ausgegangen, dass nicht mediabezogene Testvariablen keinen verzögerten Effekt haben. Die Einbeziehung nicht mediabezogener Testvariablen in Knoten \(T\) ist weiterhin zulässig, da ein Pfeil darauf hinweist, dass zwischen jedem Variablenpaar in verbundenen Knoten möglicherweise ein kausaler Effekt besteht. Wenn Sie nicht mediabezogene Testvariablen in Knoten \(T\) einbeziehen, wird die Darstellung des gerichteten azyklischen Graphen (Directed Acyclic Graph, DAG) übersichtlicher. Mit dem DAG kann weiterhin bestimmt werden, welche Variablen das Backdoor-Kriterium erfüllen.
Angenommen, Sie möchten den kausalen Effekt der Testvariablen (\(T1\) und\(T2\)) auf den KPI für Zeitraum 2 (\(K2\)) schätzen. Aus dem DAG geht hervor, dass die Kontrollvariablen für Zeitraum 2 (\(C2\)) das Backdoor-Kriterium erfüllen.
Die wichtigsten Schlussfolgerungen sind, dass die MMM-Regression für jeden Zeitraum folgende Bedingungen berücksichtigen sollte:
- Kostenpflichtige und organische Media aus dem aktuellen und allen vorangegangenen Zeiträumen, bis zu einer angenommenen maximalen Verzögerungsdauer.
- Nur nicht mediabezogene Testvariablen des aktuellen Zeitraums.
- Nur Kontrollvariablen des aktuellen Zeitraums.
Beachten Sie dabei Folgendes:
- Ein Pfeil von \(C1\) zu \(C2\) hat keine Auswirkungen darauf, welche Variablen in die Regression einbezogen werden.
- Bei einem Pfeil von \(C1\) zu \(K2\) muss die Regression verzögerte Kontrollvariablen enthalten. In der Praxis ist es am besten, dies nach Möglichkeit zu vermeiden, da sich dadurch die Anzahl der Regressionsparameter erheblich erhöhen kann.
- Ein Pfeil von \(T1\) zu \(C2\) ist problematisch. In diesem Fall ist \(C2\) nämlich sowohl eine Mediatorvariable als auch ein Störfaktor. Mit einem einzelnen MMM-Regressionsmodell kann der kausale Gesamteffekt der Testvariablen nicht abgeleitet werden.
- Das Hinzufügen des Pfads \(T2 \leftarrow K1 \rightarrow K2\) ist aus demselben Grund problematisch. Dann ist \(K1\) nämlich sowohl Mediatorvariable als auch Störfaktor.