Genera grafici di diagnostica del modello dall'adattamento del modello Meridian.
meridian.analysis.visualizer.ModelDiagnostics(
meridian: meridian.model.model.Meridian
)
Metodi
plot_prior_and_posterior_distribution
Visualizza sorgente
plot_prior_and_posterior_distribution(
parameter: str = 'roi_m',
num_geos: int = 3,
selected_times: (list[str] | None) = None
) -> (alt.Chart | alt.FacetChart)
Grafica le distribuzioni a priori e a posteriori per un parametro del modello.
| Arg |
parameter
|
Nome del parametro del modello da tracciare. Per impostazione predefinita, il parametro ROI viene
mostrato se non viene specificato un nome.
|
num_geos
|
Numero di aree geografiche più grandi per popolazione da mostrare nei grafici per i parametri a livello di località. Per impostazione predefinita, vengono mostrati
solo i primi tre dati geografici più grandi.
|
selected_times
|
Elenco di periodi di tempo specifici da tracciare per i parametri a livello di tempo. Questi orari devono corrispondere ai periodi di tempo specificati nei dati. Per impostazione predefinita, vengono tracciati i primi tre periodi di tempo.
|
| Resi |
|
Un grafico Altair che mostra le distribuzioni dei parametri.
|
| Aumenti |
NotFittedModelError
|
Il modello non è stato adattato.
|
ValueError
|
parameter non è un parametro del modello Meridian.
|
plot_rhat_boxplot
Visualizza codice sorgente
plot_rhat_boxplot() -> alt.Chart
Grafica il grafico a scatola di R-hat.
Riepilogo visivo della potenziale riduzione della scala di Gelman e Rubin (1992) per la convergenza della catena, comunemente nota come R-hat. Si tratta di una misura diagnostica della convergenza che misura il grado in cui la varianza (delle medie) tra le catene supera ciò che ti aspetteresti se le catene fossero distribuite in modo identico. I valori vicini a 1,0 indicano la convergenza. R-hat < 1,2 indica una convergenza approssimativa ed è una soglia ragionevole per molti problemi (Brooks e Gelman, 1998).
Esiste un singolo valore R-hat per ogni parametro del modello. Il grafico a scatola
riassume la distribuzione dei valori di R-hat negli indici. Ad esempio, il riquadro corrispondente a beta_gm riassume la distribuzione dei valori R-hat sia nell'indice geografico g sia nell'indice del canale m.
R-hat non è definito per i parametri con priori deterministici, pertanto questi parametri non vengono visualizzati nel box plot.
| Riferimenti |
|
Andrew Gelman e Donald B. Rubin. Interruzione della simulazione iterativa
utilizzando più sequenze. Statistical Science, 7(4):457-472, 1992.
Stefano P. Brooks e Andrew Gelman. Metodi generali per il monitoraggio
della convergenza della simulazione iterativa
|
| Resi |
|
Un grafico Altair che mostra il box plot di R-hat per parametro.
|
| Aumenti |
NotFittedModelError
|
Il modello non è stato indossato.
|
MCMCSamplingError
|
Il campionamento MCMC non ha raggiunto la convergenza.
|
predictive_accuracy_table
Visualizza sorgente
predictive_accuracy_table(
selected_geos: (Sequence[str] | None) = None,
selected_times: (Sequence[str] | None) = None,
column_var: (str | None) = None,
batch_size: int = c.DEFAULT_BATCH_SIZE
) -> pd.DataFrame
Mostra l'accuratezza predittiva del DataFrame.
| Args |
selected_geos
|
Elenco facoltativo di un sottoinsieme di dimensioni geografiche da includere. Per impostazione predefinita, sono inclusi tutti i dati geografici. I valori geografici devono corrispondere ai nomi delle dimensioni geografiche di meridian.InputData. Imposta selected_geos o
n_top_largest_geos, non impostarli entrambi.
|
selected_times
|
Elenco facoltativo di un sottoinsieme di dimensioni temporali da includere.
Per impostazione predefinita, sono inclusi tutti gli orari. Le ore devono corrispondere alle dimensioni temporali
da meridian.InputData.
|
column_var
|
Stringa facoltativa che indica se eseguire la rotazione della tabella in base a metric, geo_granularity o evaluation_set. Per impostazione predefinita,
column_var=None indica che le colonne metric, geo_granularity e
value (insieme a evaluation_set quando holdout_id non è None)
vengono visualizzate nel DataFrame non pivot.
|
batch_size
|
Numero intero che rappresenta il numero massimo di estrazioni per catena in ogni lotto. Il calcolo viene eseguito in batch per evitare l'esaurimento
della memoria. Se si verifica un errore di memoria, prova a ridurre batch_size. Il
calcolo sarà generalmente più rapido con valori batch_size più alti.
|
| Resi |
Un DataFrame contenente i valori calcolati di R_Squared, MAPE e wMAPE. Se holdout_id esiste, i dati vengono suddivisi in sezioni Train, Test e All Data e evaluation_set viene incluso come colonna nella trasformazione da set di dati a DataFrame.
|