GRU算法

前置知识:RNN,LSTM

LSTM需要训练的参数很多,极消耗计算资源。GRU是一种LSTM的改进算法,参数更少,更容易训练。

它将忘记门和输入门合并成为一个单一的更新门,同时合并了数据单元状态和隐藏状态,使得模型结构比之于LSTM更为简单。

结构

GRU的整体结构图与RNN没有区别

reset重置门

r_t=\sigma(W_z·[h_{t-1},x_t]+b_r)

rt就是重置门,得到rt后,将rt与上一时刻传入的ht-1进行点乘,得到重置之后的数据,并与xt进行拼接。

h_{t-1}^{'}=h_{t-1}*r_t \\h'=tanh(w*[h_{t-1}',x_t]+b)

h'包含了输入信息xt,经过选择后的上一时刻的信息h't-1,

update更新门

Z_t=\sigma(W_z·[h_{t-1},x_t]+b_z) \\h_t=z_t*h_{t-1}+(1-z_t)*h'

  • z*ht-1:表示对隐藏状态选择性的遗忘;

  • (1-z)*h':表示对包含当前节点信息的h'选择性的记忆

最近更新

  1. TCP协议是安全的吗?

    2024-01-02 11:32:03       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-01-02 11:32:03       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-01-02 11:32:03       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-01-02 11:32:03       18 阅读

热门阅读

  1. ansible搭建和基本使用

    2024-01-02 11:32:03       42 阅读
  2. 数据库-期末考前复习-第1章-绪论

    2024-01-02 11:32:03       33 阅读
  3. React 实现 Step组件

    2024-01-02 11:32:03       44 阅读
  4. react怎么实现跨页面传参

    2024-01-02 11:32:03       40 阅读
  5. AtCoder Beginner Contest 297(A-E)

    2024-01-02 11:32:03       44 阅读