meridian.analysis.visualizer.ModelDiagnostics

Generiert Diagramme zur Modelldiagnose aus der Anpassung des Meridian-Modells.

Methoden

plot_prior_and_posterior_distribution

Quelle ansehen

Stellt Prior- und Posterior-Verteilungen für einen Modellparameter dar.

Argumente
parameter Name des Modellparameters, der dargestellt werden soll. Wenn kein Name angegeben ist, wird standardmäßig der ROI-Parameter angezeigt.
num_geos Anzahl der größten geografischen Einheiten nach Bevölkerung, die in den Diagrammen für die Parameter auf geografischer Ebene angezeigt werden sollen. Standardmäßig werden nur die drei größten Einheiten angezeigt.
selected_times Liste der Zeiträume, die für Parameter auf Zeitebene dargestellt werden sollen. Diese Zeiten müssen mit den Zeiträumen in den Daten übereinstimmen. Standardmäßig werden die ersten drei Zeiträume dargestellt.

Ausgabe
Ein Altair-Diagramm mit den Parameterverteilungen.

Löst aus
NotFittedModelError Das Modell wurde nicht angepasst.
ValueError Ein parameter ist kein Meridian-Modellparameter.

plot_rhat_boxplot

Quelle ansehen

Stellt das R-hat-Boxplot dar.

Visuelle Zusammenfassung der potenziellen Skalenreduktion für Kettenkonvergenz nach Gelman und Rubin (1992), allgemein als R-hat bezeichnet. Das ist eine Methode zur Konvergenzdiagnose, mit der gemessen wird, inwieweit die Varianz (der Mittelwerte) zwischen den Ketten den Wert überschreitet, der bei einer identischen Verteilung der Ketten zu erwarten wäre. Werte nahe 1,0 deuten auf eine Konvergenz hin. Ein R-hat-Wert < 1,2 weist auf eine ungefähre Konvergenz hin und ist ein angemessener Grenzwert für viele Probleme (Brooks und Gelman, 1998).

Für jeden Modellparameter gibt es einen einzelnen R-hat-Wert. Das Boxplot fasst die Verteilung der R-hat-Werte über die Indexe zusammen. Das Boxplot für beta_gm fasst beispielsweise die Verteilung der R-hat-Werte sowohl für den geografischen Index g als auch für den Channel-Index m zusammen.

Der R-hat-Wert ist für Parameter mit deterministischen Priors nicht definiert. Daher werden diese Parameter im Boxplot nicht angezeigt.

Verweise
Andrew Gelman und Donald B. Rubin. Inference from Iterative Simulation Using Multiple Sequences. Statistical Science, 7(4):457–472, 1992. Stephen P. Brooks und Andrew Gelman. General Methods for Monitoring Convergence of Iterative Simulations.

Ausgabe
Ein Altair-Diagramm mit dem R-hat-Boxplot pro Parameter.

Löst aus
NotFittedModelError Das Modell wurde nicht angepasst.
MCMCSamplingError Die MCMC-Stichproben sind nicht konvergiert.

predictive_accuracy_table

Quelle ansehen

Zeigt die Vorhersagegenauigkeit des DataFrames an.

Argumente
selected_geos Optionale Liste einer Teilmenge der geografischen Dimensionen, die eingeschlossen werden sollen. Standardmäßig sind alle geografischen Einheiten enthalten. Die geografischen Einheiten müssen den Namen der geografischen Dimensionen aus meridian.InputData entsprechen. Legen Sie entweder selected_geos oder n_top_largest_geos fest, aber nicht beide.
selected_times Optionale Liste einer Teilmenge der Zeitdimensionen, die eingeschlossen werden sollen. Standardmäßig sind alle Zeiten enthalten. Die Zeiten müssen mit den Zeitdimensionen aus meridian.InputData übereinstimmen.
column_var Optionaler String, der angibt, ob die Tabelle nach metric, geo_granularity oder evaluation_set pivotiert werden soll. Standardmäßig gibt column_var=None an, dass die Spalten metric, geo_granularity und value (zusammen mit evaluation_set, wenn holdout_id nicht None ist) im zurückgegebenen nicht pivotierten DataFrame angezeigt werden.
batch_size Ganzzahl, die die maximale Anzahl der Ziehungen pro Kette in jedem Batch angibt. Die Berechnung wird in Batches ausgeführt, um eine Überlastung des Arbeitsspeichers zu vermeiden. Wenn ein Speicherfehler auftritt, versuchen Sie, batch_size zu verringern. Die Berechnung ist in der Regel bei größeren batch_size-Werten schneller.

Ausgabe
Ein DataFrame mit den berechneten Werten R_Squared, MAPE und wMAPE. Wenn holdout_id vorhanden ist, werden die Daten in die Unterabschnitte (Train, Test und All Data) aufgeteilt und evaluation_set wird als Spalte in der Transformation von Dataset zu DataFrame eingefügt.