Machine Learning | Google for Developers

学习速率和收敛

这是一系列 Playground 练习中的第一个。 Playground 是一个节目专为本课程而设计，旨在讲授机器学习原理。本课程中的每个 Playground 练习都包含一个嵌入式 Playground 实例。

每个 Playground 练习都会生成一个数据集。此具有两个可能的值。您可以把它们想象成可能的值是垃圾邮件而不是垃圾邮件，或者可能是健康的树与生病的树。大多数练习的目标是通过调整各种超参数来构建该模型可成功分类（分离或区分）标签值。请注意，大多数数据集都包含因为噪声量太大，导致模型无法成功分类的 每一个样本。

点击加号图标即可查看关于模型可视化的说明。

每个 Playground 练习都会显示当前模型的状态。例如，以下是一个可视化图表：

关于模型可视化，请注意以下几点：

每个轴代表一个特定的特征。对于垃圾邮件和非垃圾邮件，特征可以是单词数、电子邮件。
注意：适当的轴值取决于特征数据。上面显示的轴值不适合字数或收件人数量，因为这两者都不能为负数。
每个点表示一个数据样本的特征值，例如电子邮件。
点的颜色表示该样本所属的类。例如，蓝点可能表示非垃圾邮件，而橙色的圆点可能表示垃圾邮件。
背景颜色表示模型对样本位置的预测该颜色的容器。蓝点周围的蓝色背景意味着模型正确预测了该样本。相反，一个蓝点周围显示橙色背景表示并错误地预测该样本。
背景的蓝色和橙色部分会有深浅之分。例如，可视化图表为纯蓝色，但中间逐渐淡化为白色直观展示数据您可以将颜色强度视为对模型的置信度。因此纯蓝色表示对所猜出的结果非常有信心，浅蓝色表示置信度降低。（图中所示的模型可视化效果预测很糟糕。）

使用可视化结果来判断模型的进度。（“非常好，大部分蓝点都有蓝色背景”或 “糟糕！蓝点有橙色背景。”）游乐场也会以数字形式显示模型的当前损失。（“糟糕！损失正在上升，而不是下降。”）

本练习的界面提供了三个按钮：

图标	名称	功能
	重置	将 `Iterations` 重置为 0。重置该模型的所有权重模型。
	第	推进一次迭代。每次迭代时，有时是细微变化，有时是巨大变化。
	重新生成	生成新的数据集。不会重置 `Iterations`。

在第一个 Playground 练习中，您将尝试学习速率。

任务 1：注意界面右上角的学习速率菜单游乐场。给定的学习速率 (3) 非常高。观察计算这种高学习速率会对模型产生怎样的影响，按钮 10 或 20 次。每次早期迭代后，请注意模型直观方面发生巨大变化。您甚至可能会遇到不稳定的情况之后。另请注意运行从 x₁ 和 x₂ 到模型可视化。权重这几条线表示模型中这些特征的权重。也就是说，粗线表示权重较高。

任务 2：执行以下操作：

按重置按钮。
降低学习速率。
多次按“步”按钮。

较低的学习速率对收敛有何影响？检查模型收敛所需的步数，以及然后稳定地收敛。尝试更小的值学习速率。有没有发现速度过慢而无用？（您将可在练习正下方找到相关讨论。）

点击加号图标即可查看关于任务 2 的讨论。

由于 Playground 练习具有不确定性，我们无法始终提供与您的数据集完全一致的答案。也就是说，对我们来说，0.1 的学习速率能够有效地收敛。学习速率越小，收敛所花费的时间就越长；也就是说，学习速率太慢，以致无用。