李沐72_深度学习优化算法——自学笔记

局部最小VS全局最小

使用迭代优化算法求解,一般只能保证找到局部最小值。

凸函数优化

1.如果代价函数f是凸,且限制集合C是凸,那么就是凸优化问题,局部最小一定是全局最小

2.严格凸优化问题有唯一的全局最小

1.线性回归

2.softmax

非凸

其他均是,MLP、CNN、RNN、attention…

梯度下降

最简单的迭代求解算法

随机梯度下降

比梯度下降成本低

小批量随机梯度下降

1.计算单样本的梯度很难完全利用硬件资源

冲量法

使用平滑过的梯度对权重更新,beta的常见取值[0.5,0.9,0.95,0.99]

总结

1.深度学习模型大部分是凸

2.小批量随机梯度下降是最常用的优化算法

3.冲量对梯度做平滑

4.Adam对梯度做平滑,且对梯度各个维度值做重新调整


相关推荐

  1. 72_深度学习优化算法——自学笔记

    2024-04-30 07:32:02       28 阅读
  2. 63_束搜索——自学笔记

    2024-04-30 07:32:02       29 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-30 07:32:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-30 07:32:02       101 阅读
  3. 在Django里面运行非项目文件

    2024-04-30 07:32:02       82 阅读
  4. Python语言-面向对象

    2024-04-30 07:32:02       91 阅读

热门阅读

  1. 利用Python生成器和迭代器高效处理大数据文件

    2024-04-30 07:32:02       30 阅读
  2. 99个Python函数语法从小白进阶大佬

    2024-04-30 07:32:02       33 阅读
  3. vue 下载pdf

    2024-04-30 07:32:02       31 阅读
  4. ARM Summary 4 I2C communication

    2024-04-30 07:32:02       30 阅读
  5. 安卓第三方app调用system/lib库报错的问题

    2024-04-30 07:32:02       30 阅读
  6. Linux:升级OpenSSL和OpenSSH

    2024-04-30 07:32:02       33 阅读
  7. [STL剖析] 01 引言

    2024-04-30 07:32:02       30 阅读
  8. 亲子公园剧本杀小程序ar互动寻宝游戏开发搭建

    2024-04-30 07:32:02       34 阅读
  9. leetcode1329--将矩阵按对角线排序

    2024-04-30 07:32:02       37 阅读
  10. 第11章:GO的微服务架构

    2024-04-30 07:32:02       31 阅读