解读损失曲线

如果第一次训练模型时,所有损失曲线都如下所示,则可以轻松进行机器学习:

显示训练机器学习模型时理想损失曲线的图表。损失曲线在 y 轴上绘制了 x 轴上训练步数的损失。随着训练步数的增加,损失开始增加,然后呈指数下降,并最终展平,从而达到最低损失。

但实际上,理解曲线损失并非易事。通过理解损失曲线来回答以下问题。

1. 我的模型无法训练!

您的好友 Mel 和您继续一起开发独角兽外观预测器。这是您的第一条损失曲线。

损失曲线图与上一个图表使用相同的轴。在这里,损失不会趋于平坦,而是不稳定地增加和减少,使图表振动。

描述问题以及 Mel 可以如何解决此问题:

2. 我的损失爆炸了!

Mel 显示了另一条曲线。出了什么问题?她该如何解决这个问题? 请在下方输入您的答案。

损失曲线图,显示损失如何减少到一定数量的训练步,然后随着进一步训练步的增加突然增加。

3. 我的指标相互矛盾!

梅尔希望您再尝试一条曲线。出了什么问题?她该如何解决这个问题?请在下方输入您的答案。

图片显示了两张图。左侧的曲线图显示了理想的损失曲线。右侧的图表显示,即使训练步数增加,召回率指标也保持为 0。

描述问题以及 Mel 可以如何解决此问题:

4. 测试损失太高!

Mel 向您展示训练和测试数据集的损失曲线,并询问“出了什么问题?”。请在下方输入您的答案。

损失曲线图,显示训练模型时测试损失与测试损失之间的差异。

描述问题以及 Mel 可以如何解决此问题:

5. 我的模型遇到问题

几天后,Mel 又回来了,又开始了另一条曲线,你有耐心。这里出了什么问题?如何解决 Mel 的问题?

损失曲线图,显示损失在训练后开始收敛,但显示类似矩形波的重复模式。

描述问题以及 Mel 可以如何解决此问题:

大功告成!

“目前一切正常!”马六大声说。她成功地靠在椅子上,长长地叹气。曲线看起来很棒,您用成就来传输。Mel 和您花点时间讨论以下用于验证模型的附加检查。

  • 实际指标
  • 基准
  • 回归问题的绝对损失
  • 分类问题的其他指标
  • 显示会收敛的损失曲线的图表。