静的トレーニングと動的トレーニング: 理解度を確認する

動的(オンライン)トレーニング

以下の選択肢をご覧ください。

次の記述のうち、動的(オンライン)トレーニングの説明として正しいものを 1 つ選択してください。
新しいデータが届くと、モデルは最新の状態が維持されます。
これがオンライン トレーニングの主なメリットです。新しいデータが入り次第、モデルをトレーニングできるようにすることで、多くの未更新の問題を回避できます。
トレーニング ジョブのモニタリングが必要になることはほとんどありません。
実際には、トレーニング ジョブが正常で、意図したとおりに機能していることを確認するため、継続的にモニタリングする必要があります。また、バグのあるジョブや入力データの破損など、トレーニングで問題が発生した場合にモデルを以前のスナップショットにロールバックする機能など、サポート インフラストラクチャも必要です。
推論時に入力データのモニタリングをほとんど行う必要はありません。
静的なオフライン モデルと同様に、動的に更新されるモデルへの入力をモニタリングすることも重要です。大きな季節性の影響が生じるリスクはおそらくないでしょうが、入力に対する突然の大きな変更(アップストリーム データソースのダウンなど)は、依然として信頼性の低い予測を引き起こす可能性があります。

静的(オフライン)トレーニング

以下の選択肢をご覧ください。

静的(オフライン)トレーニングの説明として正しいものは次のうちどれですか。
新しいデータが届くと、モデルは最新の状態が維持されます。
実際、オフラインでトレーニングする場合、新しいデータが到着してもモデルに取り込むことはできません。時間の経過とともに変化して変化する分布から学習しようとしている場合、モデルが未更新になる可能性があります。
本番環境に適用する前にモデルを検証できます。
はい。オフライン トレーニングでは、モデルを本番環境に導入する前に、モデルのパフォーマンスを検証できます。
オフライン トレーニングでは、オンライン トレーニングよりもトレーニング ジョブのモニタリングが少なくなります。
一般に、オフライン トレーニングの場合、トレーニング時のモニタリング要件はそれほど厳しくないため、本番環境に関する多くの考慮事項から解放されます。ただし、モデルをトレーニングする頻度が高いほど、モニタリングに必要な投資は高くなります。また、コード(とその依存関係)の変更がモデルの品質に悪影響を与えないように、定期的に検証する必要があります。
推論時に入力データのモニタリングをほとんど行う必要はありません。
直感に反して、サービング時に入力データをモニタリングする必要があります。入力分布が変化すると、モデルの予測の信頼性が損なわれる可能性があります。たとえば、夏服のデータのみでトレーニングしたモデルが、突然、冬の衣料品購入行動を予測するために使用されたとします。