meridian.analysis.visualizer.ModelDiagnostics

Generuje wykresy diagnostyczne modelu na podstawie dopasowania modelu południowego.

Metody

plot_prior_and_posterior_distribution

Wyświetl źródło

Wyświetla rozkłady wstępne i poprzednie dla parametru modelu.

Argumenty
parameter Nazwa parametru modelu do wykreślenia. Domyślnie parametr ROI jest widoczny, jeśli nie podasz nazwy.
num_geos Liczba największych danych geograficznych o populacji, które mają się pojawiać na wykresach dla parametrów na poziomie danych geograficznych. Domyślnie wyświetlane są tylko 3 największe obszary geograficzne.
selected_times Lista konkretnych okresów, które należy uwzględnić na potrzeby parametrów czasu. Te czasy muszą być zgodne z okresami czasu z danych. Domyślnie nanoszone są pierwsze 3 okresy.

Zwroty
Wykres Altair przedstawiający rozkład parametrów.

Promowanie
NotFittedModelError Model nie został dopasowany.
ValueError parameter nie jest parametrem modelu Meridian.

plot_rhat_boxplot

Wyświetl źródło

Rysuje fabułę R-hat.

Wizualne podsumowanie potencjalnej redukcji skali na potrzeby zbieżności łańcuchowej przez Gelmana i Rubina (1992), powszechnie nazywanej kapeluszem R-hat. Jest to diagnostyczny wskaźnik zbieżności, który mierzy stopień, w jaki wariancja (średnich) między łańcuchami przekracza wartości oczekiwane, gdyby łańcuchy były rozłożone identycznie. Wartości bliskie 1,0 oznaczają zbieżność. Wartość R-hat < 1,2 wskazuje przybliżoną zbieżność i stanowi rozsądny próg w przypadku wielu problemów (Brooks i Gelman, 1998 r.).

Każdy parametr modelu ma jedną wartość R-hat. Wykres ramkowy podsumowuje rozkład wartości R-hat wśród indeksów. Na przykład pole odpowiadające beta_gm podsumowuje rozkład wartości R-hat w indeksie geograficznym g i indeksie kanału m.

Parametr ten nie jest zdefiniowany dla żadnych parametrów, które mają deterministyczne priorytety, więc te parametry nie są pokazywane na wykresie.

Pliki referencyjne
Andrew Gelman i Donald B. Rubin. Wywnioskowanie z symulacji iteracyjnej przy użyciu wielu sekwencji. Statistsal Science, 7(4):457-472, 1992. Stephen P. Brooksa i Andrew Gelmana. Ogólne metody monitorowania zbieżności iteracyjnej symulacji

Zwroty
Wykres Altair z wykresem ramkowym dla każdego parametru.

Promowanie
NotFittedModelError Model nie został dopasowany.
MCMCSamplingError Próbkowanie MCMC nie było zgodne.

predictive_accuracy_table

Wyświetl źródło

Wyświetla dokładność przewidywania w ramach DataFrame.

Argumenty
selected_geos Opcjonalna lista podzbioru wymiarów geograficznych do uwzględnienia. Domyślnie uwzględniane są wszystkie regiony geograficzne. Dane geograficzne powinny być zgodne z nazwami wymiarów geograficznych z meridian.InputData. Ustaw wartość selected_geos lub n_top_largest_geos, ale nie ustawiaj obu.
selected_times Opcjonalna lista podzbioru wymiarów czasowych, które można uwzględnić. Domyślnie uwzględniane są wszystkie godziny. Czas musi być zgodny z wymiarami czasowymi z meridian.InputData.
column_var Opcjonalny ciąg znaków wskazujący, czy tabela ma być przestawna według właściwości metric, geo_granularity czy evaluation_set. Domyślnie column_var=None wskazuje, że kolumny metric, geo_granularity i value (oraz evaluation_set, gdy holdout_id nie jest None) są wyświetlane w zwracanym nieskierowanym DataFrame.
batch_size Liczba całkowita określająca maksymalną liczbę pobrań na łańcuch w każdej partii. Obliczenia są wykonywane partiami, aby uniknąć wyczerpania pamięci. Jeśli wystąpi błąd pamięci, spróbuj zmniejszyć wartość batch_size. Obliczenie zwykle przebiega szybciej przy większych wartościach batch_size.

Zwroty
DataFrame zawierający obliczone wartości R_Squared, MAPE i wMAPE. Jeśli istnieje zmienna holdout_id, dane są dzielone na podzbiory Train, Test i All Data, a zmienna evaluation_set jest uwzględniana jako kolumna w przekształceniu z Dataset na DataFrame.