神经网络——数据预处理

基于方差缩放的参数初始化

方差缩放方法能够根据神经元的链接数量来自适应地调整初始化分布地方差,尽可能的保证每个神经元的输入和输出方差一致。

那么,为什么要保证前后方差的一致性呢?

这是因为如果输入空间和输出空间的方差差别较大,也就是说数据空间分布差异较大,那么在反向传播时可能会引起梯度消失或爆炸问题。
比如,当输入空间稀疏,输出空间稠密时,将在输出空间计算得到的误差反向传播给输入空间时,这个误差可能会显得微不足道,从而引起梯度消失。而当输入空间稠密,输出空间稀疏时,将误差反向传播给输入空间,就可能会引起梯度爆炸,使得模型震荡。

参考:

深度学习基础入门篇[六]:模型调优,学习率设置(Warm Up、loss自适应衰减等),batch size调优技巧,基于方差放缩初始化方法。-腾讯云开发者社区-腾讯云 (tencent.com)

相关推荐

  1. 神经网络——数据预处理

    2024-07-13 17:18:12       22 阅读
  2. 神经网络数据预处理知识点

    2024-07-13 17:18:12       47 阅读
  3. 循环神经网络之文本预处理

    2024-07-13 17:18:12       29 阅读
  4. 神经网络数学原理

    2024-07-13 17:18:12       24 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-13 17:18:12       67 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-13 17:18:12       72 阅读
  3. 在Django里面运行非项目文件

    2024-07-13 17:18:12       58 阅读
  4. Python语言-面向对象

    2024-07-13 17:18:12       69 阅读

热门阅读

  1. C 标准库 - <stdio.h>

    2024-07-13 17:18:12       20 阅读
  2. 等保2.0对云计算有哪些特定的安全要求?

    2024-07-13 17:18:12       20 阅读
  3. [Spring Boot]Rest服务调用远程Get、Post请求

    2024-07-13 17:18:12       21 阅读
  4. 今日科技圈最新时事新闻(2024年7月12日

    2024-07-13 17:18:12       21 阅读
  5. Leetcode刷题4--- 寻找两个正序数组的中位数 Python

    2024-07-13 17:18:12       21 阅读
  6. 网络安全那些梗

    2024-07-13 17:18:12       20 阅读
  7. lntroducing Machine Learning

    2024-07-13 17:18:12       21 阅读
  8. react学习——29react之useState使用

    2024-07-13 17:18:12       23 阅读