大まかに言うと、モデルをトレーニングする方法は 2 つあります。
- 静的モデルはオフラインでトレーニングされます。つまりモデルを 1 回トレーニングしてから
そのトレーニング済みモデルをしばらく使用します
- 動的モデルはオンラインでトレーニングされます。つまり、データは継続的にシステムに入力され、継続的な更新によってモデルに取り込まれます。
静的トレーニングと動的トレーニング
ML システム パラダイム: トレーニング
静的モデル -- オフラインでのトレーニング
ML システム パラダイム: トレーニング
静的モデル -- オフラインでのトレーニング
動的モデル -- オンラインでのトレーニング
ML システム パラダイム: トレーニング
静的モデル -- オフラインでのトレーニング
- ビルドとテストが簡単。バッチ トレーニングとテストを行い、問題がなければイテレーションを行います。
動的モデル -- オンラインでのトレーニング
ML システム パラダイム: トレーニング
静的モデル -- オフラインでのトレーニング
- ビルドとテストが簡単。バッチ トレーニングとテストを行い、問題がなければイテレーションを行います。
- やはり入力のモニタリングが必要
動的モデル -- オンラインでのトレーニング
ML システム パラダイム: トレーニング
静的モデル -- オフラインでのトレーニング
- ビルドとテストが簡単。バッチ トレーニングとテストを行い、問題がなければイテレーションを行います。
- やはり入力のモニタリングが必要
- 情報が古くなるのは簡単です
動的モデル -- オンラインでのトレーニング
ML システム パラダイム: トレーニング
静的モデル -- オフラインでのトレーニング
- ビルドとテストが簡単。バッチ トレーニングとテストを行い、問題がなければイテレーションを行います。
- やはり入力のモニタリングが必要
- 情報が古くなるのは簡単です
動的モデル -- オンラインでのトレーニング
- 継続的にトレーニング データをフィードし、定期的に更新版を同期します。
- トレーニングとテストのバッチ処理ではなく、段階的な検証を使用します。
ML システム パラダイム: トレーニング
静的モデル -- オフラインでのトレーニング
- ビルドとテストが簡単。バッチ トレーニングとテストを行い、問題がなければイテレーションを行います。
- やはり入力のモニタリングが必要
- 情報が古くなるのは簡単です
動的モデル -- オンラインでのトレーニング
- 継続的にトレーニング データをフィードし、定期的に更新版を同期します。
- トレーニングとテストを一括して行うのではなく、段階的な検証を使用する
- モニタリング、モデルのロールバック、データ検疫の機能が必要
- 変更に適応し、未更新の問題を回避できる
講義のまとめ(動画)
大まかに言うと、トレーニングの静的または動的な決定を左右するのは以下の点です。
- 静的モデルはビルドとテストが容易です。
- 動的モデルはデータの変化に適応します。
世界は大きく変わりやすい場所です。昨年のデータを基に作成された販売予測では、翌年の結果の予測が成功する可能性は低くなります。
データセットが時間の経過とともに変化しない場合は、静的トレーニングを選択します。静的トレーニングは、動的トレーニングよりも作成と維持にかかる費用が少なくてすみます。しかし、多くの情報源は時間の経過とともに変化します。たとえば、海面など、一定だと思える特徴を持つ情報源でも変わりません。道徳観: 静的トレーニングであっても、入力データの変化を監視する必要があります。
たとえば、ユーザーが花を購入する確率を予測するようにトレーニングされたモデルについて考えてみましょう。時間のプレッシャーから、このモデルは 7 月と 8 月の花の購入行動のデータセットを使用して 1 回だけトレーニングされます。その後、モデルは本番環境で予測を行うために送信されますが、更新されることはありません。このモデルは数か月間は正常に動作しますが、バレンタイン デーの時期はユーザー行動が著しく変化するため、その頃にはひどい予測を行います。