このページは Cloud Translation API によって翻訳されました。

損失曲線の解釈

最初にモデルをトレーニングしたときに、すべての損失曲線が次のようになると、機械学習を簡単に実現できます。

機械学習モデルをトレーニングする際の理想的な損失曲線を示すプロット。損失曲線は、y 軸の損失を、x 軸のトレーニングステップ数に対してプロットします。トレーニングステップの数が増えると損失は大きくなり、その後、指数関数的に減少します。最終的には、最小限の損失まで平坦化します。

しかし実際には、損失曲線の解釈は非常に難しい場合があります。損失曲線について理解し、次の質問に答えてください。

1. モデルが学習されない

友だちのメルさんは、ユニコーンの外観の予測に引き続き取り組んでいます。こちらが最初の損失曲線です。

前のプロットと同じ軸を持つ損失曲線プロット。この場合、損失は平坦化するのではなく、不規則に増減し、プロットが振動します。

メルさんが問題をどのように解決できるかを説明します。

プラスアイコンをクリックすると、セクションが展開され、正解が表示されます。

モデルが収束していません。次のデバッグ手順をお試しください。

モデルのデバッグの手順に沿って、特徴がラベルを予測できるかどうかを確認します。
データスキーマとデータを確認して、不適切な例を検出します
このプロットのようにトレーニングが不安定に見える場合は、学習率を下げて、モデルがパラメータ空間で跳ね回らないようにします。
データセットの予測が容易な 10 のサンプルに簡略化される。情報量が削減されたデータセットで極めて低い損失を取得します。その後、データセット全体に対するモデルのデバッグを続けます。
モデルを単純化し、モデルがベースラインを上回るようにします。そして、モデルの複雑さが徐々に増えていきます。

2. ダイバーシティ

Mel は別の曲線を表示します。どのような点が問題で、どうすれば解決できますか？以下に回答を入力してください。

損失が特定の数のステップまで減少し、さらにトレーニングのステップで急激に増加する様子を示す損失曲線のプロット。

メルさんが問題を修正する方法と、その方法を説明する。

プラスアイコンをクリックすると、セクションが展開され、正解が表示されます。

損失の大幅な増加は通常、入力データの異常値が原因で発生します。考えられる原因:

入力データ内の NaN。
異常なデータによる勾配の急増。
ゼロ除算。
0 または負の数の対数。

爆発的な損失を修正するには、バッチとエンジニアリングデータで異常なデータをチェックします。異常があると思われる場合は、原因を調査してください。それ以外の場合、異常が外れ値のように見える場合は、データをシャッフルして、バッチ間で外れ値が均等に分散されるようにします。

3. 自分の指標が矛盾している

メルさんは別の曲に挑戦したいと思っています。どのような点が問題で、どうすれば解決できますか。以下に回答を入力してください。

画像は 2 つのプロットを示しています。左側のプロットは、理想的な損失曲線を示しています。右側のプロットは、トレーニングステップ数が増えても再現率の指標が 0 のままであることを示しています。

メルさんが問題をどのように解決できるかを説明します。

プラスアイコンをクリックしてセクションを展開すると、答えが表示されます。

サンプルの分類確率がポジティブな分類のしきい値を超えることはないため、再現率は 0 で停止します。この状況は、多くの場合、クラスの不均衡が大きいときに発生します。通常、TF Keras などの ML ライブラリでは、分類しきい値の計算にデフォルトのしきい値 0.5 を使用します。

次の手順をお試しください。

分類のしきい値を下げます。

しきい値の不変の指標（AUC など）を確認します。