动手学深度学习54 循环神经网络

动手学深度学习54 循环神经网络

1. 循环神经网络RNN

h t h_t ht h t − 1 h_{t-1} ht1 x t − 1 x_{t-1} xt1有关
x t x_t xt h t h_t ht x t − 1 x_{t-1} xt1 有关
在这里插入图片描述
怎么把潜变量变成RNN–假设更简单
潜变量和隐变量的区别:隐变量通常是现实生活中存在的东西,只是我们没有观察到;潜变量可指代现实生活中不存在(人为创造)的东西。
隐变量:一个向量。
在这里插入图片描述
输出【o_t】发生在观察【x_t】之前。根据o_t和x_t的值计算损失。
φ:激活函数。输出不需要激活函数。
RNN: 在MLP中加了一项 W h h h t − 1 W_{hh}h_{t-1} Whhht1, 和前一个时间状态的 h t − 1 h_{t-1} ht1发生关系。所有x的信息都存储到h里面。 W h h W_{hh} Whh存储时序信息。
在这里插入图片描述
n个输出的多分类交叉熵损失平均值,再取指数–困惑度。
做指数,损失数值会变大。
困惑度=1,下面候选词词概率最高。=2 候选两个词都很有可能。
在这里插入图片描述
clipping
g:表示所有层的梯度放在一起
theta:=5 或者=10
g值正常,不做处理,g过大,将值处理成theta,保证g不会过大–不会超过theta值,防止梯度爆炸。
在这里插入图片描述
在这里插入图片描述
可视化RNN:
https://www.bilibili.com/video/BV1z5411f7Bm/?vd_source=eb04c9a33e87ceba9c9a2e5f09752ef8

2. QA

循环神经网络可以认为是一个简单的递归网络。递归理解为何树一样的东西。
在这里插入图片描述
在这里插入图片描述
14: tracking? 目标追踪

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-10 06:40:03       99 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-10 06:40:03       107 阅读
  3. 在Django里面运行非项目文件

    2024-07-10 06:40:03       90 阅读
  4. Python语言-面向对象

    2024-07-10 06:40:03       98 阅读

热门阅读

  1. Elasticsearch 8 支持别名查询

    2024-07-10 06:40:03       32 阅读
  2. LVS集群

    2024-07-10 06:40:03       35 阅读
  3. rust way step 1

    2024-07-10 06:40:03       36 阅读
  4. .gitmodules文件

    2024-07-10 06:40:03       32 阅读
  5. git提交emoji指南

    2024-07-10 06:40:03       26 阅读
  6. 自动化测试的秘诀:Conda包依赖的智能检测之旅

    2024-07-10 06:40:03       33 阅读
  7. 升级之道:精通Conda的自我升级艺术

    2024-07-10 06:40:03       32 阅读
  8. python拆分Excel数据,自动发邮箱

    2024-07-10 06:40:03       26 阅读
  9. 【LeetCode】169. 多数元素

    2024-07-10 06:40:03       31 阅读
  10. Docker基础使用

    2024-07-10 06:40:03       35 阅读
  11. c_各个unsigned int 和 int的取值范围

    2024-07-10 06:40:03       25 阅读
  12. SVG in VSCode: A Comprehensive Guide

    2024-07-10 06:40:03       28 阅读
  13. 缓存新境界:Eureka中服务的分布式缓存实现策略

    2024-07-10 06:40:03       29 阅读