降低损失 (Reducing Loss):检查您的理解情况
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
检查您的理解情况:批次大小
了解以下选项。
在大型数据集上执行梯度下降法时,以下哪个批量大小可能更高效?
完整批次。
从全批次计算梯度的效率并不高。也就是说,与非常大的全批次相比,小批次计算梯度的效率通常更高(且准确度一样高)。
小批量,甚至是包含一个样本的批量 (SGD)。
令人惊讶的是,对小批量甚至包含一个样本的批量执行梯度下降法通常比对全批量更高效。毕竟,计算一个样本的梯度比计算数百万个样本的梯度要低得多。
为确保获得良好的代表性样本,该算法在每次迭代时都会抽取另一个随机的小批次(或一个批次的批次)。
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2023-12-02。
[{
"type": "thumb-down",
"id": "missingTheInformationINeed",
"label":"没有我需要的信息"
},{
"type": "thumb-down",
"id": "tooComplicatedTooManySteps",
"label":"太复杂/步骤太多"
},{
"type": "thumb-down",
"id": "outOfDate",
"label":"内容需要更新"
},{
"type": "thumb-down",
"id": "translationIssue",
"label":"翻译问题"
},{
"type": "thumb-down",
"id": "samplesCodeIssue",
"label":"示例/代码问题"
},{
"type": "thumb-down",
"id": "otherDown",
"label":"其他"
}]
[{
"type": "thumb-up",
"id": "easyToUnderstand",
"label":"易于理解"
},{
"type": "thumb-up",
"id": "solvedMyProblem",
"label":"解决了我的问题"
},{
"type": "thumb-up",
"id": "otherUp",
"label":"其他"
}]