【跟马少平老师学AI】-【神经网络是怎么实现的】(七-1)词向量

一句话归纳:

1)神经网络不仅可以处理图像,还可以处理文本。

2)神经网络处理文本,先要解决文本的表示(图像的表示用像素RGB)。

3)独热编码词向量:

  • 词表:{我,在,清华大学,读书,生活,美丽的,清华园,中}
  • 词向量:

清华大学=[0,0,1,0,0,0,0,0]

清华园=[0,0,0,0,0,0,1,0]

美丽的=[0,0,0,0,0,1,0,0]

  • 特点:向量太长,每两个向量之间的距离都是一样的。

4)稠密向量:

猪向量=[1.0,0.1,1.0]

羊向量=[1.0,0.2,1.0]

熊猫=[1.0,0.3,0]

白菜=[0,1.0,1.0]

竹子=[0,1.0,0.1]

可计算向量间的距离。

5)神经网络语言模型:

  • 给定一句话的前n-1个词,预测第n个词是什么词的概率。
  • 用神经网络实现的,为神经网络语言模型。

6)最大似然估计,通过让联合概率最大化估计概率的方法。

7)神经网络语言模型的似然函数:

8)对似然函数进行对数转换,取相反数,求最小值。

可以用梯度下降法了。

9)用BP算法训练的不仅是神经网络语言模型的参数,也包含词向量。

10)稠密词向量可以计算两个向量的距离,有语义意义。

最近更新

  1. TCP协议是安全的吗?

    2024-05-04 18:52:04       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-05-04 18:52:04       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-05-04 18:52:04       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-05-04 18:52:04       20 阅读

热门阅读

  1. C语言总结四:函数(压缩版)

    2024-05-04 18:52:04       12 阅读
  2. 简历总结:打造HR无法拒绝的简历

    2024-05-04 18:52:04       12 阅读
  3. 【需求工程概述】

    2024-05-04 18:52:04       11 阅读
  4. springcloud(智慧养老平台)

    2024-05-04 18:52:04       13 阅读
  5. codeforces round 879 div2 (a,b,c)

    2024-05-04 18:52:04       12 阅读
  6. 第Ⅰ章-V package.json文件详解

    2024-05-04 18:52:04       10 阅读
  7. 爬⾍监控与⾃动恢复机制

    2024-05-04 18:52:04       8 阅读
  8. Nodejs-异步并发控制

    2024-05-04 18:52:04       9 阅读