Membuat plot diagnostik model dari penyesuaian model Meridian.
meridian.analysis.visualizer.ModelDiagnostics(
meridian: meridian.model.model.Meridian
)
Metode
plot_prior_and_posterior_distribution
Lihat sumber
plot_prior_and_posterior_distribution(
parameter: str = 'roi_m',
num_geos: int = 3,
selected_times: (list[str] | None) = None
) -> (alt.Chart | alt.FacetChart)
Membuat plot distribusi sebelumnya dan posterior untuk parameter model.
| Args |
parameter
|
Nama parameter model yang akan dipetakan. Secara default, parameter ROI akan ditampilkan jika nama tidak ditentukan.
|
num_geos
|
Jumlah geo terbesar berdasarkan populasi yang akan ditampilkan dalam plot untuk
parameter tingkat geografis. Secara default, hanya tiga wilayah geografis terbesar
yang ditampilkan.
|
selected_times
|
Daftar jangka waktu tertentu untuk diplot untuk parameter
tingkat waktu. Waktu ini harus cocok dengan jangka waktu dari data. Secara default, tiga jangka waktu pertama dipetakan.
|
| Hasil |
|
Plot Altair yang menunjukkan distribusi parameter.
|
| Memunculkan |
NotFittedModelError
|
Model belum dipasang.
|
ValueError
|
parameter bukan parameter model Meridian.
|
plot_rhat_boxplot
Lihat sumber
plot_rhat_boxplot() -> alt.Chart
Membuat plot kotak R-hat.
Ringkasan visual pengurangan skala potensial Gelman & Rubin (1992) untuk
konvergensi rantai, yang biasanya disebut sebagai R-hat. Ini adalah ukuran diagnostik
konvergensi yang mengukur tingkat varians (rata-rata)
antara rantai yang melebihi yang Anda harapkan jika rantai didistribusikan secara
identik. Nilai yang mendekati 1,0 menunjukkan konvergensi. R-hat < 1,2 menunjukkan perkiraan konvergensi dan merupakan ambang batas yang wajar untuk banyak masalah (Brooks & Gelman, 1998).
Ada satu nilai R-hat untuk setiap parameter model. Box plot
menyampulkan distribusi nilai R-hat di seluruh indeks. Misalnya,
kotak yang sesuai dengan beta_gm meringkas distribusi nilai R-hat
di seluruh indeks geografis g dan indeks saluran m.
R-hat tidak ditentukan untuk parameter apa pun yang memiliki prior deterministik,
sehingga parameter ini tidak ditampilkan pada boxplot.
| Referensi |
|
Andrew Gelman dan Donald B. Rubin. Inferensi dari Simulasi Iteratif
Menggunakan Beberapa Urutan. Statistical Science, 7(4):457-472, 1992.
Stephen P. Brooks dan Andrew Gelman. Metode Umum untuk Pemantauan
Konvergensi Simulatio Iteratif
|
| Hasil |
|
Plot Altair yang menampilkan boxplot R-hat per parameter.
|
| Raise (Mengedepankan) |
NotFittedModelError
|
Model belum dipasang.
|
MCMCSamplingError
|
Sampling MCMC tidak diterapkan.
|
predictive_accuracy_table
Lihat sumber
predictive_accuracy_table(
selected_geos: (Sequence[str] | None) = None,
selected_times: (Sequence[str] | None) = None,
column_var: (str | None) = None,
batch_size: int = c.DEFAULT_BATCH_SIZE
) -> pd.DataFrame
Menampilkan akurasi prediktif DataFrame.
| Args |
selected_geos
|
Daftar opsional subset dimensi geografis yang akan disertakan. Secara default, semua geografis disertakan. Geografis harus cocok dengan nama dimensi geografis dari meridian.InputData. Tetapkan selected_geos atau
n_top_largest_geos, jangan tetapkan keduanya.
|
selected_times
|
Daftar opsional subkumpulan dimensi waktu yang akan disertakan.
Secara default, semua waktu disertakan. Waktu harus cocok dengan dimensi waktu
dari meridian.InputData.
|
column_var
|
String opsional yang menunjukkan apakah akan membuat pivot tabel berdasarkan metric, geo_granularity, atau evaluation_set. Secara default,
column_var=None menunjukkan bahwa kolom metric, geo_granularity, dan
value (beserta evaluation_set jika holdout_id bukan None)
ditampilkan dalam DataFrame yang tidak di-pivot yang ditampilkan.
|
batch_size
|
Bilangan bulat yang mewakili jumlah pengambilan maksimum per rantai dalam
setiap batch. Penghitungan dijalankan dalam batch untuk menghindari kehabisan
memori. Jika terjadi error memori, coba kurangi batch_size. Penghitungan
umumnya akan lebih cepat dengan nilai batch_size yang lebih besar.
|
| Hasil |
DataFrame yang berisi nilai R_Squared, MAPE, dan wMAPE
yang dihitung. Jika holdout_id ada, data akan dibagi menjadi subbagian Train, Test, dan All Data, dan evaluation_set akan disertakan sebagai kolom dalam transformasi dari Dataset ke DataFrame.
|