Generuje wykresy diagnostyczne modelu na podstawie dopasowania modelu południowego.
meridian.analysis.visualizer.ModelDiagnostics(
meridian: meridian.model.model.Meridian
)
Metody
plot_prior_and_posterior_distribution
Wyświetl źródło
plot_prior_and_posterior_distribution(
parameter: str = 'roi_m',
num_geos: int = 3,
selected_times: (list[str] | None) = None
) -> (alt.Chart | alt.FacetChart)
Wyświetla rozkłady wstępne i poprzednie dla parametru modelu.
| Argumenty |
parameter
|
Nazwa parametru modelu do wykreślenia. Domyślnie parametr ROI jest widoczny, jeśli nie podasz nazwy.
|
num_geos
|
Liczba największych danych geograficznych o populacji, które mają się pojawiać na wykresach dla parametrów na poziomie danych geograficznych. Domyślnie wyświetlane są tylko 3 największe obszary geograficzne.
|
selected_times
|
Lista konkretnych okresów, które należy uwzględnić na potrzeby parametrów czasu. Te czasy muszą być zgodne z okresami czasu z danych. Domyślnie nanoszone są pierwsze 3 okresy.
|
| Zwroty |
|
Wykres Altair przedstawiający rozkład parametrów.
|
| Promowanie |
NotFittedModelError
|
Model nie został dopasowany.
|
ValueError
|
parameter nie jest parametrem modelu Meridian.
|
plot_rhat_boxplot
Wyświetl źródło
plot_rhat_boxplot() -> alt.Chart
Rysuje fabułę R-hat.
Wizualne podsumowanie potencjalnej redukcji skali na potrzeby zbieżności łańcuchowej przez Gelmana i Rubina (1992), powszechnie nazywanej kapeluszem R-hat. Jest to diagnostyczny wskaźnik zbieżności, który mierzy stopień, w jaki wariancja (średnich) między łańcuchami przekracza wartości oczekiwane, gdyby łańcuchy były rozłożone identycznie. Wartości bliskie 1,0 oznaczają zbieżność. Wartość R-hat < 1,2 wskazuje przybliżoną zbieżność i stanowi rozsądny próg w przypadku wielu problemów (Brooks i Gelman, 1998 r.).
Każdy parametr modelu ma jedną wartość R-hat. Wykres ramkowy podsumowuje rozkład wartości R-hat wśród indeksów. Na przykład pole odpowiadające beta_gm podsumowuje rozkład wartości R-hat w indeksie geograficznym g i indeksie kanału m.
Parametr ten nie jest zdefiniowany dla żadnych parametrów, które mają deterministyczne priorytety, więc te parametry nie są pokazywane na wykresie.
| Pliki referencyjne |
|
Andrew Gelman i Donald B. Rubin. Wywnioskowanie z symulacji iteracyjnej przy użyciu wielu sekwencji. Statistsal Science, 7(4):457-472, 1992.
Stephen P. Brooksa i Andrew Gelmana. Ogólne metody monitorowania zbieżności iteracyjnej symulacji
|
| Zwroty |
|
Wykres Altair z wykresem ramkowym dla każdego parametru.
|
| Promowanie |
NotFittedModelError
|
Model nie został dopasowany.
|
MCMCSamplingError
|
Próbkowanie MCMC nie było zgodne.
|
predictive_accuracy_table
Wyświetl źródło
predictive_accuracy_table(
selected_geos: (Sequence[str] | None) = None,
selected_times: (Sequence[str] | None) = None,
column_var: (str | None) = None,
batch_size: int = c.DEFAULT_BATCH_SIZE
) -> pd.DataFrame
Wyświetla dokładność przewidywania w ramach DataFrame.
| Argumenty |
selected_geos
|
Opcjonalna lista podzbioru wymiarów geograficznych do uwzględnienia. Domyślnie uwzględniane są wszystkie regiony geograficzne. Dane geograficzne powinny być zgodne z nazwami wymiarów geograficznych z meridian.InputData. Ustaw wartość selected_geos lub n_top_largest_geos, ale nie ustawiaj obu.
|
selected_times
|
Opcjonalna lista podzbioru wymiarów czasowych, które można uwzględnić.
Domyślnie uwzględniane są wszystkie godziny. Czas musi być zgodny z wymiarami czasowymi
z meridian.InputData.
|
column_var
|
Opcjonalny ciąg znaków wskazujący, czy tabela ma być przestawna według właściwości metric, geo_granularity czy evaluation_set. Domyślnie
column_var=None wskazuje, że kolumny metric, geo_granularity i
value (oraz evaluation_set, gdy holdout_id nie jest None)
są wyświetlane w zwracanym nieskierowanym DataFrame.
|
batch_size
|
Liczba całkowita określająca maksymalną liczbę pobrań na łańcuch w każdej partii. Obliczenia są wykonywane partiami, aby uniknąć wyczerpania pamięci. Jeśli wystąpi błąd pamięci, spróbuj zmniejszyć wartość batch_size. Obliczenie zwykle przebiega szybciej przy większych wartościach batch_size.
|
| Zwroty |
DataFrame zawierający obliczone wartości R_Squared, MAPE i wMAPE. Jeśli istnieje zmienna holdout_id, dane są dzielone na podzbiory Train, Test i All Data, a zmienna evaluation_set jest uwzględniana jako kolumna w przekształceniu z Dataset na DataFrame.
|