LLM - 词向量 Word2vec

1. 词向量是一个词的低维表示,词向量可以反应语言的一些规律,词意相近的词向量之间近乎于平行。

2. 词向量的实现:

    (1)首先使用滑动窗口来构造数据,一个滑动窗口是指在一段文本中连续出现的几个单词,这样的单词构成一个窗口。在这个窗口中最中间的词叫做目标词(Target), 其他的词称为上下文词(Context)。

    (2)根据上下文词(Context)预测目标词(Target)的神经网络模型叫做CBOW模型。

    (3)根据目标词(Target)预测上下文词(Context)的神经网络模型叫做Skip-Gram模型。

3. CBOW模型示意:用never和late预测中间词too的过程。

    (1)首先将never,late表示成onehot向量.

    (2)其次用这两个onehot向量在最终要训练的词向量矩阵中,找到never,late对应的词向量。然后把它们加起来做平均,这样可以得到一个临时的词向量,维度和前面两个相同。

    (3)用上面得到的临时词向量对词表中每个词做点乘,得到n个输出,n是词表大小。

    (4)对n个输出做softmax,得到每个词分类概率分布。

4. Skip-Gram模型示意:例子目标词是Never,要预测出too,late,to, learn。过程是先让模型去预测P(too/Never), 然后再预测P(late/Never)...

https://arxiv.org/abs/1301.3781

相关推荐

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-10 20:54:03       5 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-10 20:54:03       5 阅读
  3. 在Django里面运行非项目文件

    2024-07-10 20:54:03       4 阅读
  4. Python语言-面向对象

    2024-07-10 20:54:03       7 阅读

热门阅读

  1. 从零到一:构建股票预测模型的Python实战教程

    2024-07-10 20:54:03       9 阅读
  2. SpringBoot | 面试题

    2024-07-10 20:54:03       7 阅读
  3. Shell学习——Shell printf命令

    2024-07-10 20:54:03       9 阅读
  4. Linux实现CPU物理隔离

    2024-07-10 20:54:03       10 阅读
  5. Redis 中的跳表(Skip List)

    2024-07-10 20:54:03       11 阅读
  6. 路由器是什么?

    2024-07-10 20:54:03       10 阅读
  7. redis实现延时队列

    2024-07-10 20:54:03       10 阅读
  8. Shell选择结构

    2024-07-10 20:54:03       14 阅读
  9. Poincaré图和SD2计算参考

    2024-07-10 20:54:03       10 阅读
  10. C#控件总结

    2024-07-10 20:54:03       9 阅读