rnn相关

构成

比之前多了一个圈
在这里插入图片描述
这个圈包含t时刻之前的数据特征,主要用在NLP自然语言处理中。

在这里插入图片描述
只用最后一个结果ht,前面的当做中间结果

特点

会把之前看到的都记下来,但第n句话和第一句话之间联系不太大,没必要

LSTM

在这里插入图片描述

自然语言处理

考虑词的 前后顺序和相关性
在这里插入图片描述
构建词向量,不断向后滑动学习

cbow 和skip-gram方法

在这里插入图片描述

  • cbow输入上下文,输出预测最中间的位置的词
  • skip-gram 输入中间的词,输出预测的上下文

改进方法

在这里插入图片描述
加入一些负样本(负采样模型) 顺序的词太多了,需要加乱序的词,作为负样本

在这里插入图片描述
skipgram的正负样本模型

实战

词嵌入:将词转化为向量
每个词用300维的向量表示,词大小为32

(batch,maxlen,featrue)
(同时处理多少标题或者文章,序列的最大长度,feature大小(300维))
基于字做的,在此数据集中有4000+个可能,而词更多,运算量大

LSTM

在这里插入图片描述
self.lstm = nn.LSTM(config.embed(300维的输入特征), config.hidden_size(128个隐藏神经元), config.num_layers(两层的LSTM),
bidirectional=True(是单向的还是双向的,双向的效果好), batch_first=True, dropout=config.dropout)

双向的LSTM在这里插入图片描述

特征最后会拼接起来,维度更多了

在这里插入图片描述
上图是3层LSTM(淡蓝色部分),一般用最后一层最后一个输出作为最终输出,因为它包含并计算了前面神经元的特征信息

例子中的模型

Model(
(embedding): Embedding(4762, 300)
(lstm): LSTM(300, 128, num_layers=2, batch_first=True, dropout=0.5, bidirectional=True)
(fc): Linear(in_features=256, out_features=10, bias=True)
)

NLP任务大部分是分类任务

相关推荐

  1. <span style='color:red;'>rnn</span><span style='color:red;'>相关</span>

    rnn相关

    2024-01-22 15:28:01      36 阅读
  2. pytorch RNN

    2024-01-22 15:28:01       31 阅读
  3. <span style='color:red;'>RNN</span>实战

    RNN实战

    2024-01-22 15:28:01      15 阅读
  4. Basic <span style='color:red;'>RNN</span>

    Basic RNN

    2024-01-22 15:28:01      20 阅读
  5. RNN神经网络 python

    2024-01-22 15:28:01       39 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-01-22 15:28:01       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-01-22 15:28:01       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-01-22 15:28:01       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-01-22 15:28:01       18 阅读

热门阅读

  1. 事务复习1-理论基础

    2024-01-22 15:28:01       34 阅读
  2. 问题解决:django模型查询报错,找不到数据库表

    2024-01-22 15:28:01       37 阅读
  3. 集齐用 channel 把 Go 程序写崩的三种姿势~

    2024-01-22 15:28:01       25 阅读
  4. 【webrtc】跟webrtc学时间戳、序号类型转换

    2024-01-22 15:28:01       27 阅读
  5. lc142.环形链表Ⅱ

    2024-01-22 15:28:01       37 阅读
  6. Golang leetcode459 拼接+kmp算法

    2024-01-22 15:28:01       34 阅读
  7. 三、需求规格说明书(软件工程示例)

    2024-01-22 15:28:01       36 阅读
  8. 二分答案刷题4

    2024-01-22 15:28:01       38 阅读