Wnioskowanie Bayesa

Meridian korzysta z modelu regresji bayesowskiej, który łączy wcześniejsze informacje z danymi uzyskanymi z danych, aby oszacować wpływ mediów i określić niepewność. Wcześniejsze dane są uwzględniane w modelu na podstawie wcześniejszych rozkładów, które mogą być oparte na danych z eksperymentów, doświadczeniu w branży lub poprzednich modelach marketingu mieszanego.

Metody próbkowania bayesowskich łańcuchów Markowa (MCMC) są używane do wspólnej estymacji wszystkich współczynników i parametrów modelu. Obejmuje to parametry funkcji nieliniowych transformacji mediów, takich jak krzywe Adstock i malejących przychodów. Podczas obliczania szacunków punktowych i wiarygodnych przedziałów wyników zwrotu z inwestycji oraz innych kluczowych statystyk uwzględniane są wszystkie parametry i odpowiednie niepewności.

Twierdzenie Bayesa

Twierdzenie Bayesa mówi, jak można używać danych obserwowalnych do wyciągania wniosków o nieobserwowalnych parametrach, które można wyrazić za pomocą tej zależności:

$$ P(\theta|data)\ =\ \dfrac{ P(data|\theta)P(\theta) }{ \int \! P(data|\theta)P(\theta) \, \mathrm{d}\theta } $$

Gdzie:

  • \(\theta\) to obserwowany parametr
  • \(P(\theta|data)\) to wartość oszacowania a posteriori, która jest wynikiem równania bayesowskiego.
  • \(P(data|\theta)\) to prawdopodobieństwo
  • \(P(\theta)\) jest poprzedni

Aby przeprowadzić wnioskowanie na podstawie prawdopodobieństwa warunkowego, należy podać prawdopodobieństwo i wartość wstępną.

Prawdopodobieństwo, wartości wstępne i wartości a posteriori

Prawdopodobieństwo to specyfikacja modelu. Jest to rozkład, który określa prawdopodobieństwo wartości danych na podstawie wartości parametrów modelu.\(\theta\)Po przeprowadzeniu analizy bayesowskiej na podstawie parametrów tworzone są wnioski i oszacowania. \(\theta\)Prawdopodobieństwo może mieć różny stopień złożoności. Prawdopodobieństwo Meridiana jest oparte na hierarchicznej regresji. Więcej informacji o modelu Meridian znajdziesz w specyfikacji.

Wstępna wartość reprezentuje przekonanie o rozkładzie prawdopodobieństwa parametru przed uwzględnieniem danych. W przypadku podejścia bayesowskiego do ilościowego określania niepewności uwzględnienie wiedzy wstępnej jest wymagane. W Meridian dystrybucja wstępna odzwierciedla przekonania dotyczące efektów działań marketingowych przed ich sprawdzeniem. Informacyjne priory wyrażają wysoką pewność w przypadku \(\theta\), co wymaga dużej ilości danych dowodowych, aby przezwyciężyć tę wiarę. Nieinformująca wartość wstępna to wyrażenie bardzo małej wiedzy o wartości \(\theta\) , więc ma niewielki wpływ. Model Meridian udostępnia dobrze uzasadnione priorytety z wartościami domyślnymi. Możesz dostosować priorytety, np. w celu kalibracji zwrotu z inwestycji.

Współczynnik posterior to rozkład, który reprezentuje siłę przekonania o różnych możliwych wartościach \(\theta\) po uwzględnieniu danych. Wartość ta jest określana na podstawie wartości wstępnej, danych i prawdopodobieństwo zgodnie z twierdzeniem Bayesa. Jeśli dane zawierają niewiele informacji, posterior jest bardziej zorientowany na priory. Jeśli dane zawierają obszerne informacje, prawdopodobieństwo warunkowe jest bardziej zorientowane na dane.

Model Meridian generuje wspólny rozkład wsteczny dla wszystkich parametrów modelu oraz wszystkich szacowanych danych, takich jak ROI, mROI i krzywe odpowiedzi. Rozkład warunkowy reprezentuje zaktualizowane przekonania dotyczące efektów działań marketingowych na podstawie obserwowanych danych.

Konwergencja MCMC

Za pomocą metody Monte Carlo z łańcuchem Markowa (MCMC) próbkowanie wsteczne zmierza do rozkładu docelowego. Konwergencję modelu można ocenić, uruchamiając wiele łańcuchów MCMC i sprawdzając, czy wszystkie łańcuchy osiągają ten sam rozkład docelowy.

Meridian używa metody próbkowania MCMC No U-Turn Sampler (NUTS). Wartości parametrów są pobierane z rozkładu prawdopodobieństwa, którego rozkład bieżącej wartości zależy od wartości z poprzedniej iteracji. Wartości te tworzą łańcuch, w którym każda iteracja jest pełnym zestawem wartości parametrów modelu. Wiele łańcuchów jest uruchamianych niezależnie, aby ocenić zbieżność. Po osiągnięciu zbieżności każdy łańcuch reprezentuje próbkę z docelonej rozkładu warunkowego. Następnie można je scalić w celu dalszych wnioskowań.

Aby ocenić zbieżność MCMC, musisz sprawdzić wartości R-hat. Te wartości są podawane w ramach danych wyjściowych modelu. Zalecamy uzyskanie wartości R-hat mniejszej niż 1,1 w przypadku wszystkich parametrów, choć nie jest to ścisła wartość progowa. Jeśli wartości R-hat są nieco większe niż 1,1, zbieżność można zwykle osiągnąć, wykonując dłuższe łańcuchy. Jeśli wartości R-hat są znacznie większe (np.2,0 lub więcej), można uzyskać zbieżność, wykonując dłuższe łańcuchy. Ograniczenia czasowe i pamięciowe mogą jednak uniemożliwiać osiągnięcie dokładności, więc może być konieczne dostosowanie modelu w celu uzyskania zbieżności.