このページは Cloud Translation API によって翻訳されました。

理解度をチェック: 本番環境での機械学習

パイプラインテストのガイドラインは Colab で実証することはできません。その代わり、以下の演習を通じてガイドラインの実践演習を行います。次のページでは、このガイドラインを実装するためのリソースについて説明します。

次の質問については、選択内容をクリックして展開し、回答を確認してください。

ユニコーンの外観予測器を起動した後、新しいデータを再トレーニングして予測器を最新の状態に保つ必要があります。収集する新しいデータが多すぎるため、トレーニング用に新しいデータを一定の期間にわたってサンプリングすることにします。また、ユニコーンの外観における日単位および年単位のパターンも考慮する必要があります。新しいモデルバージョンをリリースできるのは 3 か月以内です。どの時間枠を選択しますか。

1 日。期間を大きくすると、大量のデータが生成され、モデルのトレーニングに時間がかかりすぎるためです。

不正解です。データサンプリングレートを調整して、データセットのサイズを制限できます。モデルの更新は 3 か月に 1 回のみになるため、1 日分のデータでトレーニングされたモデルは徐々に古くなります。

データセットが大きすぎないようにするための 1 週間ですが、パターンを滑らかにできます。

不正解です。データサンプリングレートを調整して、データセットのサイズを制限できます。モデルの更新は 3 か月に 1 回のみになるため、1 週間分のデータでトレーニングされたモデルは徐々に古くなります。

1 年ごと。モデルが日ごとまたは年次パターンによってバイアスされないようにします。

そのとおりです。すべてのシナリオでモデルが予測を学習できるように、代表的なデータセットを選択してください。

ユニコーンの外観予測ツールを起動します。順調です。3 週間後に休暇に戻り、モデルの品質が大幅に低下していることに気づきました。ユニコーンの動作は 3 週間で、大幅に変化する可能性は低いものと想定します。品質低下の原因として最も可能性が高いのは次のうちどれですか。

トレーニング / サービングスキュー。

正解です。Unicorn の動作は変わっていないと思われますが、トレーニングデータが収集された後に、サービングデータの基盤となるデータレポートやデータ形式が変更された可能性があります。サービングデータをトレーニングデータのデータスキーマに照らして確認することで、潜在的なトレーニング / サービングスキューを検出します。

固定しきい値でモデルの品質をテストし忘れました。

不正解です。モデルの品質のテストは、品質の低下の検出には役立ちますが、減少した理由を説明するものではありません。

モデルが最新ではありません。

不正解です。前述の質問で説明したように、トレーニングデータがユニコーンの動作のすべてのサイクルに対応していると仮定します。

そこには十分なトレーニングデータがないため、南極の予測をモニタリングすることにしました。特に冬の間は、予測の品質が不思議なほど低下します。原因は何でしょうか。

環境要因。

正解です。南極の嵐は予測品質の低下と相関関係があることに気づきました。このような嵐の中、ユニコーンの動作は変化します。さらに、南極で暴風雨が発生したときにデータを収集することは不可能です。つまり、このような条件では、モデルをトレーニングできません。

モデルが古くなる。

不正解です。原因が正しければ、数日間だけ低下するのではなく、モデルが陳腐化するため、品質は継続的に低下します。

必要な理由はありません。ML モデルにはランダム性があります。

不正解です。モデルの品質が変動する場合は、原因を調査する必要があります。再現性を高めるには、モデルのトレーニングでランダム性を排除するようにしてください。

ユニコーンの外観予測因子は 1 年間運用されています。多くの問題を修正し、品質が向上しました。小さな問題が続いていることに気づきました。都市部ではモデルの品質が若干低下しました。原因は何でしょうか。

予測の品質が高いため、ユーザーは簡単にユニコーンを見つけられます。そのため、ユニコーンの外観の動作に影響を及ぼします。

正解です。ユニコーンは、都市部での行動を変えて、注意の高まりに対応しました。モデルの予測は変化する動作に適応するため、ユニコーンは引き続き動作を変えます。モデルの動作がトレーニングデータ自体に影響を与える状況は、フィードバックループと呼ばれます。ユニコーンの動作の変化に対応する提供データの変化を検出するために、トレーニング / サービングスキューの検出を変更する必要があります。

人口が多い地域では、ユニコーンの登場が複数回報告されるため、トレーニングデータが歪みます。

不正解です。このスキューによりリリース時から品質が低下する可能性があるため、これが原因ではありません。

都市部はモデル化が難しいため、

不正解です。モデルで都市部での予測が困難だった場合、開始後に品質が下がるのではなく、品質が最初から低下します。

本番環境でのテスト

実装