深度学习记录--随机初始化

权重

权重,指的是变量系数w,决定了变量的变化率

它会改变dw,进而改变下一轮的w(改变更新)

神经网络的权重

对于神经网络(含隐藏层)

由于权重的对称性,我们的隐层的神经单元输出始终不变,出现隐藏神经元的对称性

这种对称性会导致a值和w值无法进行正常的迭代更新,导致每层的节点作用式微,神经网络也就失去其作用了

 

一般来说,模型所有的权重w随机初始化,所有偏置b初始化为0

这种方法,在反向传播的过程中所有权重的导数都不相同,所以权重和偏置b都能得到更新

logistic回归的权重

下图是logistic回归的示例图

尽管当w1,w2为0时,依然可以有x1,x2不同使dw1,dw2不同,重新改变w1,w2,起到不断迭代的作用

同理,当b为0时,也是可以依照同样的过程使b重新改变,起到不断迭代的作用

辨析

总体来说,节点权重的对称性与权重的初始化对于迭代更新有着巨大的作用

一般都要将权重w随机初始化,同时附上一个适当小的常量系数(对于tanh激活函数可以让更新率变快)

更多细节详见参考文章谈谈神经网络权重为什么不能初始化为0 - 知乎 (zhihu.com)

相关推荐

  1. 深度学习踩坑记录

    2023-12-18 07:20:08       38 阅读
  2. 深度学习相关记录《一》

    2023-12-18 07:20:08       19 阅读

最近更新

  1. TCP协议是安全的吗?

    2023-12-18 07:20:08       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2023-12-18 07:20:08       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2023-12-18 07:20:08       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2023-12-18 07:20:08       18 阅读

热门阅读

  1. centos-静态ip及修改主机名

    2023-12-18 07:20:08       35 阅读
  2. 【React基础三】组件传值、高阶组件、Hook

    2023-12-18 07:20:08       37 阅读
  3. 如何使用ffmpeg高效的压缩视频

    2023-12-18 07:20:08       40 阅读
  4. C语言学习day09:运算符(下)

    2023-12-18 07:20:08       37 阅读
  5. 【Vue3练习】Vue3使用v-model以及多个v-model

    2023-12-18 07:20:08       36 阅读
  6. vue模板语法

    2023-12-18 07:20:08       35 阅读
  7. 数据结构 | 二叉树的遍历(递归&非递归)

    2023-12-18 07:20:08       34 阅读
  8. 【NeurIPS 2023】多模态联合视频生成大模型CoDi

    2023-12-18 07:20:08       45 阅读
  9. React Hooks解决了什么问题?

    2023-12-18 07:20:08       40 阅读
  10. AutoJs学习-某点阅读自动签到任务脚本

    2023-12-18 07:20:08       35 阅读
  11. Node.js初学习

    2023-12-18 07:20:08       41 阅读
  12. Axure的交互样式和情形

    2023-12-18 07:20:08       38 阅读