【LSTM和GRU极简,和最新的TT也就是状态】机器学习模型来学习状态

LSTM(长短期记忆网络)中的关键参数包括输入门、遗忘门、输出门、细胞状态和隐藏状态。以下是如何进行推理计算的示例:

LSTM参数和公式

  1. 输入门(i_t):决定输入的信息量。
    在这里插入图片描述

  2. 遗忘门(f_t):决定遗忘上一个状态的信息量。
    在这里插入图片描述

  3. 细胞状态(C_t):存储长期信息。
    在这里插入图片描述

  4. 输出门(o_t):决定输出的信息量。
    在这里插入图片描述

  5. 隐藏状态(h_t):输出短期记忆。
    [ h_t = o_t * \tanh(C_t) ]

推理计算示例

假设我们有以下输入数据和参数:
在这里插入图片描述

计算步骤

在这里插入图片描述
总结:训练所得四个权重,然后不停的更新状态,遗忘并输出在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

GRU 少了门,更新,重置,状态 3个权重。

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-16 04:52:06       67 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-16 04:52:06       72 阅读
  3. 在Django里面运行非项目文件

    2024-07-16 04:52:06       58 阅读
  4. Python语言-面向对象

    2024-07-16 04:52:06       69 阅读

热门阅读

  1. 七大排序算法的Python实现

    2024-07-16 04:52:06       22 阅读
  2. Linux命令更新-sort 和 uniq 命令

    2024-07-16 04:52:06       28 阅读
  3. 中介子方程五十九

    2024-07-16 04:52:06       25 阅读
  4. linux查找/搜索命令

    2024-07-16 04:52:06       27 阅读
  5. Django REST Framework(八)GenericAPIView5个视图扩展类

    2024-07-16 04:52:06       21 阅读
  6. 目标检测算法:原理、挑战与应用

    2024-07-16 04:52:06       26 阅读
  7. Deep Layer Aggregation【方法部分解读】

    2024-07-16 04:52:06       26 阅读
  8. Chrome调试工具

    2024-07-16 04:52:06       22 阅读
  9. 探索Mojo编程语言:AI开发者的新宠儿

    2024-07-16 04:52:06       26 阅读