深度学习记录--Adam optimization algorithm

Adam优化算法

momentum和RMSprop的结合

初始化参数:

V_{dw}=0,V_{db}=0,S_{dw}=0,S_{db}=0

先进行momentum过程:

V_{dw}=\beta1 V_{dw}+(1-\beta1)dw

V_{db}=\beta1 V_{db}+(1-\beta1)db

然后进行RMSprop过程:

S_{dw}=\beta2 S_{dw}+(1-\beta2)(dw)^2

S_{db}=\beta2 S_{db}+(1-\beta2)(db)^2

接着进行偏差修正

V_{dw}^{corrected}=V_{dw}/(1-\beta1^t),V_{db}^{corrected}=V_{db}/(1-\beta1^t)

S_{dw}^{corrected}=S_{dw}/(1-\beta2^t),S_{db}^{corrected}=S_{db}/(1-\beta2^t)

最后更新权重

w:=V_{dw}^{corrected}/\sqrt{S_{dw}^{corrected}}+\varepsilon

b:=V_{db}^{corrected}/\sqrt{S_{db}^{corrected}}+\varepsilon

 

超参数的设置

一般地,学习率\alpha需要经过多次调试之后才可得到

其他超参数一般设置为:

\beta1=0.9, \beta2=0.999, \varepsilon=10^{-8}

相关推荐

  1. 深度学习踩坑记录

    2024-01-22 04:26:01       38 阅读
  2. 深度学习相关记录《一》

    2024-01-22 04:26:01       19 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-01-22 04:26:01       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-01-22 04:26:01       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-01-22 04:26:01       19 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-01-22 04:26:01       20 阅读

热门阅读

  1. 力扣2788-按分隔符拆分字符串

    2024-01-22 04:26:01       38 阅读
  2. 【力扣每日一题】力扣2788用分隔符拆分字符串

    2024-01-22 04:26:01       37 阅读
  3. Linux之firewall最常用命令

    2024-01-22 04:26:01       31 阅读
  4. 安卓之APK瘦身与资源压缩方案

    2024-01-22 04:26:01       31 阅读
  5. 【AI】深度学习在编码中的应用(8)

    2024-01-22 04:26:01       32 阅读
  6. 自动装箱与拆箱了解吗?原理是什么?

    2024-01-22 04:26:01       34 阅读
  7. 【C++】结构体

    2024-01-22 04:26:01       30 阅读