使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
训练集和测试集
我们回到 Playground 对训练集进行实验
和测试集。
点击加号图标可查看关于橙点和蓝点含义的提醒。
在可视化图表中:
- 每个蓝点表示一类数据的一个样本(例如,
垃圾内容)。
- 每个橙点表示另一类数据的一个样本(例如
而非垃圾内容)。
- 背景颜色表示模型对样本位置的预测
该颜色的容器。蓝点周围的蓝色背景
意味着模型正确预测了该样本。相反,
一个蓝点周围显示橙色背景表示该模型
预测出该样本的错误预测。
本练习提供了一个测试集和一个训练集,它们均选自
相同的数据集。默认情况下,可视化图表仅显示训练
。如果你想查看测试集,请点击
可视化图表正下方的显示测试数据复选框。在
,请注意以下区别:
任务 1:使用指定设置运行 Playground,具体操作如下:
以下:
- 点击“运行/暂停”按钮:

- 观察测试损失值和训练损失值的变化。
- 当测试损失值和训练损失值停止变化时
或偶尔更改一次,按“运行/暂停”(Run/Pause) 按钮
以暂停 Playground。
。
请注意测试损失与训练损失之间的增量。我们会尽量减少
Delta。
任务 2:执行以下操作:
- 按 重置 (Reset) 按钮。

- 修改学习内容
比率。
- 按下“运行/暂停”(Run/Pause) 按钮:
- 让 Playground 运行至少 150 个周期。
测试损失与训练损失之间的差值是较低还是较低?
更高的学习速率?如果您同时修改两个
学习速率和
批次大小?
可选任务 3:标有训练数据百分比的滑块
可让您控制训练数据与测试数据的比例。例如:
则 90% 的数据会用于训练集,
将剩余的 10% 用于测试集。
执行以下操作:
- 降低“训练数据百分比”从 50% 到 10%
- 尝试不同的学习速率和批次大小,并记录您的
结果。
。
如果改变训练数据百分比,
学习设置?如果是,原因是什么?
点击加号图标,查看任务 1 的答案。
将学习速率设置为 3(初始设置)时,
测试损失明显高于训练损失。
点击加号图标,查看任务 2 的答案。
通过降低学习速率(例如,降至 0.001),
测试损失会降为更接近训练损失的值。在大多数运行中
增加批次大小不会影响训练损失或测试
大幅损失。然而,在少数运行中,
批次大小达到 20 或更高会导致测试损失略有下降
低于训练损失。
Playground 的数据集是随机生成的。因此,我们的
您的答案不一定与您的答案完全一致。
点击加号图标,查看任务 3 的答案。
将训练数据百分比从 50% 大幅降低至 10%
会减少训练集中的数据点数量。由于数据太少,
高批次大小和高学习速率会导致训练模型跳跃
混乱地跳动(反复跳跃到最低点上)。
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2024-08-22。
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["没有我需要的信息","missingTheInformationINeed","thumb-down"],["太复杂/步骤太多","tooComplicatedTooManySteps","thumb-down"],["内容需要更新","outOfDate","thumb-down"],["翻译问题","translationIssue","thumb-down"],["示例/代码问题","samplesCodeIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2024-08-22。"],[],[]]