使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
学习速率和收敛
这是一系列 Playground 练习中的第一个。
Playground 是一个节目
专为本课程而设计,旨在讲授机器学习原理。
本课程中的每个 Playground 练习都包含一个嵌入式 Playground
实例。
每个 Playground 练习都会生成一个数据集。此
具有两个可能的值。您可以把它们想象成
可能的值是垃圾邮件而不是垃圾邮件,或者可能是健康的树与生病的树。
大多数练习的目标是通过调整各种超参数来构建
该模型可成功分类(分离或区分)
标签值。请注意,大多数数据集都包含
因为噪声量太大, 导致模型无法成功分类的
每一个样本。
点击加号图标即可查看关于模型可视化的说明。
每个 Playground 练习都会显示当前
模型的状态。例如,以下是一个可视化图表:
关于模型可视化,请注意以下几点:
- 每个轴代表一个特定的特征。对于垃圾邮件和非垃圾邮件,
特征可以是单词数、
电子邮件。
- 每个点表示一个数据样本的特征值,例如
电子邮件。
- 点的颜色表示该样本所属的类。
例如,蓝点可能表示非垃圾邮件,而
橙色的圆点可能表示垃圾邮件。
- 背景颜色表示模型对样本位置的预测
该颜色的容器。蓝点周围的蓝色背景
意味着模型正确预测了该样本。相反,
一个蓝点周围显示橙色背景表示
并错误地预测该样本。
- 背景的蓝色和橙色部分会有深浅之分。例如,
可视化图表为纯蓝色,但中间逐渐淡化为白色
直观展示数据您可以将颜色强度视为
对模型的置信度。因此纯蓝色表示
对所猜出的结果非常有信心,浅蓝色表示
置信度降低。(图中所示的模型可视化效果
预测很糟糕。)
使用可视化结果来判断模型的进度。
(“非常好,大部分蓝点都有蓝色背景”或
“糟糕!蓝点有橙色背景。”)
游乐场
也会以数字形式显示模型的当前损失。
(“糟糕!损失正在上升,而不是下降。”)
本练习的界面提供了三个按钮:
| 图标 |
名称 |
功能 |
|
重置
|
将 Iterations 重置为 0。重置该模型的所有权重
模型。
|
|
第
|
推进一次迭代。每次迭代时,
有时是细微变化,有时是巨大变化。
|
|
重新生成
|
生成新的数据集。不会重置 Iterations。
|
在第一个 Playground 练习中,您将尝试
学习速率。
任务 1:注意界面右上角的学习速率菜单
游乐场。给定的学习速率 (3) 非常高。观察
计算这种高学习速率会对模型产生怎样的影响,
按钮 10 或 20 次。每次早期迭代后,请注意模型
直观方面发生巨大变化。您甚至可能会遇到不稳定的情况
之后。另请注意运行
从 x1 和 x2 到模型可视化。权重
这几条线表示模型中这些特征的权重。也就是说,
粗线表示权重较高。
任务 2:执行以下操作:
- 按重置按钮。
- 降低学习速率。
- 多次按“步”按钮。
较低的学习速率对收敛有何影响?检查
模型收敛所需的步数,以及
然后稳定地收敛。尝试更小的值
学习速率。有没有发现速度过慢而无用?(您将
可在练习正下方找到相关讨论。)
点击加号图标即可查看关于任务 2 的讨论。
由于 Playground 练习具有不确定性,
我们无法始终提供与您的数据集完全一致的答案。
也就是说,对我们来说,0.1 的学习速率能够有效地收敛。
学习速率越小,收敛所花费的时间就越长;也就是说,
学习速率太慢,以致无用。
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2024-08-22。
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["没有我需要的信息","missingTheInformationINeed","thumb-down"],["太复杂/步骤太多","tooComplicatedTooManySteps","thumb-down"],["内容需要更新","outOfDate","thumb-down"],["翻译问题","translationIssue","thumb-down"],["示例/代码问题","samplesCodeIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2024-08-22。"],[],[]]