使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
更复杂的特征组合
现在,我们来玩一玩一些高级特征交叉组合。
此 Playground 中的数据集
看起来有点嘈杂
飞镖游戏中的靶心,中间有蓝点
找到外圈中的橙点
点击加号图标即可查看关于模型可视化的说明。
每个 Playground 练习都会显示当前
模型的状态。例如,以下是一个可视化图表:
关于模型可视化,请注意以下几点:
- 每个轴代表一个特定的特征。对于垃圾邮件和非垃圾邮件,
特征可以是单词数、
电子邮件。
- 每个点表示一个数据样本的特征值,例如
电子邮件。
- 点的颜色表示该样本所属的类。
例如,蓝点可能表示非垃圾邮件,而
橙色的圆点可能表示垃圾邮件。
- 背景颜色表示模型对样本位置的预测
该颜色的容器。蓝点周围的蓝色背景
意味着模型正确预测了该样本。相反,
一个蓝点周围显示橙色背景表示
并错误地预测该样本。
- 背景的蓝色和橙色部分会有深浅之分。例如,
可视化图表为纯蓝色,但中间逐渐淡化为白色
直观展示数据您可以将颜色强度视为
对模型的置信度。因此纯蓝色表示
对所猜出的结果非常有信心,浅蓝色表示
置信度降低。(图中所示的模型可视化效果
预测很糟糕。)
使用可视化结果来判断模型的进度。
(“非常好,大部分蓝点都有蓝色背景”或
“糟糕!蓝点有橙色背景。”)
游乐场
也会以数字形式显示模型的当前损失。
(“糟糕!损失正在上升,而不是下降。”)
任务 1:按照指定方式运行此线性模型。花一两分钟时间(但不要
尝试不同的学习速率设置,看看能否找到
任何改进。线性模型能否针对
?
任务 2:现在尝试添加向量积特征,例如
x1x2,尝试优化效果。
任务 3:创建好模型后,检查模型输出
表面(以背景颜色显示)。
- 看起来像线性模型吗?
- 您会如何描述该模型?
(答案位于练习正下方。)
点击加号图标,查看任务 1 的答案。
不可以。线性模型无法有效地为此数据集建模。降低
学习速率可以减少损失,但损失仍然会收敛于
是不可接受的高值。
点击加号图标,即可查看任务 2 的答案。
Playground 的数据集是随机生成的。因此,我们的
您的答案不一定与您的答案完全一致。事实上,如果你
在两次运行之间重新生成数据集,但您的结果不一定总是
与之前的运行结果完全一致。尽管如此,您还是会变得更好
执行以下操作:
-
将 x12 和 x22 用作
特征组合。(将 x1x2 添加为特征组合
似乎没有帮助。)
-
降低学习速率,比如降至 0.001。
点击加号图标即可查看任务 3 的答案。
模型输出面看起来不像线性模型。相反,
看起来是椭圆形的
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2024-08-22。
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["没有我需要的信息","missingTheInformationINeed","thumb-down"],["太复杂/步骤太多","tooComplicatedTooManySteps","thumb-down"],["内容需要更新","outOfDate","thumb-down"],["翻译问题","translationIssue","thumb-down"],["示例/代码问题","samplesCodeIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2024-08-22。"],[],[]]