转换数字数据
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
您可能需要对数值数据应用两种转换:
- 归一化 - 将数字数据转换为与其他数字数据相同的比例。
- 分桶 - 将数值(通常是连续)数据转换为分类数据。
为什么要对数值特征进行归一化?
我们强烈建议对包含不同范围(例如年龄和收入)的数字特征的数据集进行归一化。当不同的特征具有不同的范围时,梯度下降法会“弹跳”并减慢收敛。Adagrad 和 Adam 等优化器可以通过为每个功能创建单独的有效学习速率来防止出现此问题。
此外,我们还建议您对涵盖各种范围的数字特征进行归一化,例如“城市人口”。如果您不对“城市人口”特征进行归一化,则训练模型可能会生成 NaN 错误。遗憾的是,当一个特征中有各种值时,Adagrad 和 Adam 等优化器无法防止出现 NaN 错误。
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2022-09-27。
[{
"type": "thumb-down",
"id": "missingTheInformationINeed",
"label":"没有我需要的信息"
},{
"type": "thumb-down",
"id": "tooComplicatedTooManySteps",
"label":"太复杂/步骤太多"
},{
"type": "thumb-down",
"id": "outOfDate",
"label":"内容需要更新"
},{
"type": "thumb-down",
"id": "translationIssue",
"label":"翻译问题"
},{
"type": "thumb-down",
"id": "samplesCodeIssue",
"label":"示例/代码问题"
},{
"type": "thumb-down",
"id": "otherDown",
"label":"其他"
}]
[{
"type": "thumb-up",
"id": "easyToUnderstand",
"label":"易于理解"
},{
"type": "thumb-up",
"id": "solvedMyProblem",
"label":"解决了我的问题"
},{
"type": "thumb-up",
"id": "otherUp",
"label":"其他"
}]