meridian.analysis.visualizer.ModelDiagnostics

Genera grafici di diagnostica del modello dall'adattamento del modello Meridian.

Metodi

plot_prior_and_posterior_distribution

Visualizza sorgente

Grafica le distribuzioni a priori e a posteriori per un parametro del modello.

Arg
parameter Nome del parametro del modello da tracciare. Per impostazione predefinita, il parametro ROI viene mostrato se non viene specificato un nome.
num_geos Numero di aree geografiche più grandi per popolazione da mostrare nei grafici per i parametri a livello di località. Per impostazione predefinita, vengono mostrati solo i primi tre dati geografici più grandi.
selected_times Elenco di periodi di tempo specifici da tracciare per i parametri a livello di tempo. Questi orari devono corrispondere ai periodi di tempo specificati nei dati. Per impostazione predefinita, vengono tracciati i primi tre periodi di tempo.

Resi
Un grafico Altair che mostra le distribuzioni dei parametri.

Aumenti
NotFittedModelError Il modello non è stato adattato.
ValueError parameter non è un parametro del modello Meridian.

plot_rhat_boxplot

Visualizza codice sorgente

Grafica il grafico a scatola di R-hat.

Riepilogo visivo della potenziale riduzione della scala di Gelman e Rubin (1992) per la convergenza della catena, comunemente nota come R-hat. Si tratta di una misura diagnostica della convergenza che misura il grado in cui la varianza (delle medie) tra le catene supera ciò che ti aspetteresti se le catene fossero distribuite in modo identico. I valori vicini a 1,0 indicano la convergenza. R-hat < 1,2 indica una convergenza approssimativa ed è una soglia ragionevole per molti problemi (Brooks e Gelman, 1998).

Esiste un singolo valore R-hat per ogni parametro del modello. Il grafico a scatola riassume la distribuzione dei valori di R-hat negli indici. Ad esempio, il riquadro corrispondente a beta_gm riassume la distribuzione dei valori R-hat sia nell'indice geografico g sia nell'indice del canale m.

R-hat non è definito per i parametri con priori deterministici, pertanto questi parametri non vengono visualizzati nel box plot.

Riferimenti
Andrew Gelman e Donald B. Rubin. Interruzione della simulazione iterativa utilizzando più sequenze. Statistical Science, 7(4):457-472, 1992. Stefano P. Brooks e Andrew Gelman. Metodi generali per il monitoraggio della convergenza della simulazione iterativa

Resi
Un grafico Altair che mostra il box plot di R-hat per parametro.

Aumenti
NotFittedModelError Il modello non è stato indossato.
MCMCSamplingError Il campionamento MCMC non ha raggiunto la convergenza.

predictive_accuracy_table

Visualizza sorgente

Mostra l'accuratezza predittiva del DataFrame.

Args
selected_geos Elenco facoltativo di un sottoinsieme di dimensioni geografiche da includere. Per impostazione predefinita, sono inclusi tutti i dati geografici. I valori geografici devono corrispondere ai nomi delle dimensioni geografiche di meridian.InputData. Imposta selected_geos o n_top_largest_geos, non impostarli entrambi.
selected_times Elenco facoltativo di un sottoinsieme di dimensioni temporali da includere. Per impostazione predefinita, sono inclusi tutti gli orari. Le ore devono corrispondere alle dimensioni temporali da meridian.InputData.
column_var Stringa facoltativa che indica se eseguire la rotazione della tabella in base a metric, geo_granularity o evaluation_set. Per impostazione predefinita, column_var=None indica che le colonne metric, geo_granularity e value (insieme a evaluation_set quando holdout_id non è None) vengono visualizzate nel DataFrame non pivot.
batch_size Numero intero che rappresenta il numero massimo di estrazioni per catena in ogni lotto. Il calcolo viene eseguito in batch per evitare l'esaurimento della memoria. Se si verifica un errore di memoria, prova a ridurre batch_size. Il calcolo sarà generalmente più rapido con valori batch_size più alti.

Resi
Un DataFrame contenente i valori calcolati di R_Squared, MAPE e wMAPE. Se holdout_id esiste, i dati vengono suddivisi in sezioni Train, Test e All Data e evaluation_set viene incluso come colonna nella trasformazione da set di dati a DataFrame.