深度学习记录--学习率衰减(learning rate decay)

学习率衰减

mini-batch梯度下降最终会在最小值附近的区间摆动(噪声很大),不会精确收敛

为了更加近似最小值,采用学习率衰减的方法

随着学习率的衰减,步长会逐渐变小,因此最终摆动的区间会很小,更加近似最小值

如下图,蓝色曲线表示mini-batch梯度下降,绿色曲线表示采用学习率衰减的梯度下降

学习率衰减的实现

1 epoch = 遍历数据1次

\alpha = \frac{1}{1+rate_{decay}*num_{epoch}} *\alpha_{0}

rate_{decay}是学习率衰减的超参数,\alpha_{0}是初始学习率,num_{epoch}是遍历次数

其他衰减方案

\alpha = \varepsilon ^{num_{epoch}}*\alpha_{0}

\alpha_{0}是初始学习率,\varepsilon是衰减常量,一般设置\varepsilon=0.95num_{epoch}是遍历次数

\alpha = \frac{k}{\sqrt{num_{epoch}}} *\alpha_{0}

\alpha_{0}是初始学习率,k是衰减常量,num_{epoch}是遍历次数

分段衰减函数

相关推荐

  1. 深度学习学习调度器Scheduler介绍

    2024-01-22 22:30:02       29 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-01-22 22:30:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-01-22 22:30:02       100 阅读
  3. 在Django里面运行非项目文件

    2024-01-22 22:30:02       82 阅读
  4. Python语言-面向对象

    2024-01-22 22:30:02       91 阅读

热门阅读

  1. 【AI】深度学习在编码中的应用(4)

    2024-01-22 22:30:02       55 阅读
  2. C语言 数据结构之循环单链表

    2024-01-22 22:30:02       55 阅读
  3. python与c#联合编程简单案例

    2024-01-22 22:30:02       49 阅读
  4. Qt 鼠标进入离开事件

    2024-01-22 22:30:02       58 阅读
  5. 详解FreeRTOS:如何查询任务状态(拓展篇—6)

    2024-01-22 22:30:02       58 阅读
  6. spring boot集成redis,以及配置database不生效问题

    2024-01-22 22:30:02       46 阅读
  7. 从0开始学习C++ 第十二课:指针强化

    2024-01-22 22:30:02       56 阅读
  8. 限制API接口访问速率

    2024-01-22 22:30:02       55 阅读
  9. python 抓包拷贝数据转发

    2024-01-22 22:30:02       56 阅读
  10. Kind 安装 kubernets集群

    2024-01-22 22:30:02       57 阅读