meridian.analysis.visualizer.ModelDiagnostics

Génère des graphiques de diagnostic du modèle à partir de l'ajustement du modèle Meridian.

Méthodes

plot_prior_and_posterior_distribution

Afficher la source

Représente les distributions a posteriori et a priori d'un paramètre de modèle.

Args
parameter Nom du paramètre du modèle à représenter. Par défaut, le paramètre du ROI est affiché si aucun nom n'est spécifié.
num_geos Nombre de zones géographiques les plus importantes par population à afficher dans les graphiques pour les paramètres géographiques. Par défaut, seules les trois principales zones géographiques sont affichées.
selected_times Liste des périodes spécifiques à représenter pour les paramètres temporels. Ces heures doivent correspondre aux périodes des données. Par défaut, les trois premières périodes sont représentées.

Renvoie
Un graphique Altair affichant les distributions des paramètres.

Génère
NotFittedModelError Le modèle n'a pas été ajusté.
ValueError parameter n'est pas un paramètre de modèle Meridian.

plot_rhat_boxplot

Afficher la source

Affiche le graphique en boîte R-hat.

Résumé visuel de la réduction potentielle de l'échelle de Gelman et Rubin (1992) pour la convergence de la chaîne, communément appelée R-hat. Il s'agit d'une mesure de diagnostic de convergence qui évalue le degré auquel la variance (des moyennes) entre les chaînes dépasse les résultats que vous pourriez attendre si les chaînes étaient distribuées de manière identique. Les valeurs proches de 1,0 indiquent une convergence. Un R-hat inférieur à 1,2 indique une convergence approximative et constitue un seuil raisonnable pour de nombreux problèmes (Brooks et Gelman, 1998).

Il existe une seule valeur R-hat pour chaque paramètre de modèle. Le graphique en boîte récapitule la distribution des valeurs de R-hat pour les index. Par exemple, la boîte correspondant à beta_gm récapitule la distribution des valeurs de R-hat pour l'index géographique g et l'index de canal m.

La valeur R-hat n'est pas définie pour les paramètres qui ont des a priori déterministes. Par conséquent, ces paramètres ne sont pas affichés sur le graphique en boîte.

Références
Andrew Gelman et Donald B. Rubin. "Inference from Iterative Simulation Using Multiple Sequences". Statistical Science, 7(4):457-472, 1992. Stephen P. Brooks et Andrew Gelman. "General Methods for Monitoring Convergence of Iterative Simulations".

Renvoie
Un graphique Altair affichant le graphique en boîte R-hat par paramètre.

Génère
NotFittedModelError Le modèle n'a pas été ajusté.
MCMCSamplingError L'échantillonnage MCMC n'a pas convergé.

predictive_accuracy_table

Afficher la source

Affiche la précision prédictive du DataFrame.

Args
selected_geos Liste facultative d'un sous-ensemble de dimensions géographiques à inclure. Par défaut, toutes les zones géographiques sont incluses. Les zones géographiques doivent correspondre aux noms des dimensions géographiques de meridian.InputData. Définissez selected_geos ou n_top_largest_geos, mais pas les deux.
selected_times Liste facultative d'un sous-ensemble de dimensions temporelles à inclure. Par défaut, toutes les heures sont incluses. Les heures doivent correspondre aux dimensions temporelles de meridian.InputData.
column_var Chaîne facultative qui indique si la table doit être croisée par metric, geo_granularity ou evaluation_set. Par défaut, column_var=None indique que les colonnes metric, geo_granularity et value (ainsi que evaluation_set lorsque holdout_id n'est pas None) sont affichées dans le DataFrame non croisé renvoyé.
batch_size Entier représentant le nombre maximal de tirages par chaîne dans chaque lot. Le calcul est exécuté par lots pour éviter l'épuisement de la mémoire. Si une erreur de mémoire se produit, essayez de réduire batch_size. Le calcul sera généralement plus rapide avec des valeurs batch_size plus élevées.

Renvoie
Un DataFrame contenant les valeurs R_Squared, MAPE et wMAPE calculées. Si holdout_id existe, les données sont divisées en sous-sections Train, Test et All Data, et evaluation_set est inclus en tant que colonne dans la transformation de l'ensemble de données en DataFrame.