損失曲線の解釈

最初にモデルをトレーニングしたときに、すべての損失曲線が次のようになると、機械学習を簡単に実現できます。

機械学習モデルをトレーニングする際の理想的な損失曲線を示すプロット。損失曲線は、y 軸の損失を、x 軸のトレーニング ステップ数に対してプロットします。トレーニング ステップの数が増えると損失は大きくなり、その後、指数関数的に減少します。最終的には、最小限の損失まで平坦化します。

しかし実際には、損失曲線の解釈は非常に難しい場合があります。損失曲線について理解し、次の質問に答えてください。

1. モデルが学習されない

友だちのメルさんは、ユニコーンの外観の予測に引き続き取り組んでいます。 こちらが最初の損失曲線です。

前のプロットと同じ軸を持つ損失曲線プロット。この場合、損失は平坦化するのではなく、不規則に増減し、プロットが振動します。

メルさんが問題をどのように解決できるかを説明します。

2. ダイバーシティ

Mel は別の曲線を表示します。どのような点が問題で、どうすれば解決できますか?以下に回答を入力してください。

損失が特定の数のステップまで減少し、さらにトレーニングのステップで急激に増加する様子を示す損失曲線のプロット。

3. 自分の指標が矛盾している

メルさんは別の曲に挑戦したいと思っています。どのような点が問題で、どうすれば解決できますか。以下に回答を入力してください。

画像は 2 つのプロットを示しています。左側のプロットは、理想的な損失曲線を示しています。右側のプロットは、トレーニング ステップ数が増えても再現率の指標が 0 のままであることを示しています。

メルさんが問題をどのように解決できるかを説明します。

4. テストの損失が高すぎます。

Mel には、データセットのトレーニングとテストの損失曲線が表示され、「何が問題ですか?」と質問されます。回答を以下に記入してください。

モデルをトレーニングしたときの、トレーニングとテストの損失の差を示す損失曲線プロット。

メルさんが問題をどのように解決できるかを説明します。

5. モデルが固まる

数日後にメルブが戻ってくると、忍耐強くです。どのような点が問題ですか。また、メルさんはどうすればそれを修正できますか。

損失がトレーニングに収束し始め、その後長方形の波のように繰り返される損失を示す損失曲線のプロット。

メルさんが問題をどのように解決できるかを説明します。

機能しています。

「現在、問題なく機能しています。」メルを感嘆させる。彼女の勝手に椅子に寄り添い、大きなため息を負っています。曲線が見やすく、ビームで達成して完了です。モデルを検証するため、次のような追加のチェックを行います。

  • 実際の指標
  • ベースライン
  • 回帰問題の絶対損失
  • 分類の問題に関するその他の指標
  • 収束する損失曲線を示すプロット。