神经网络初始化

本练习再次使用 XOR 数据,但关注的是可重复性 以及初始化的重要性。

任务 1:运行给定模型四到五次。在每次实验之前 请点击重置网络按钮,以获取新的随机初始化。 (重置网络按钮是一个圆形重置箭头,仅指向 “播放”按钮左侧)。让每次试验至少运行 500 步 以确保收敛。每个模型输出会收敛为哪种形状? 这说明了初始化在非凸形中的作用 优化?

任务 2:尝试通过添加层来让模型稍微复杂一点 以及几个额外的节点重复任务 1 中的试验。是否 是否能提高结果的稳定性?

(答案位于练习正下方。)