深度学习从入门到不想放弃-6

   这节要讲完距离基础部分就真完事了,不继续在基础中求得基础了,我发现也没人看

Image

       书接前文深度学习从入门到不想放弃-5 (qq.com)

       前文书写到要合理的设计特征是什么概念,我们再拿两个例子复习一下

      比如一个卖车网站,上节我们讲过对物体识别可以用RGB来表示颜色的维度,那在卖车网站合适吗,其实是不合适的,因为,RGB潜在就有颜色大小区分,比如深蓝,浅蓝,有大小就会产生算法倾斜;那对于一个卖车网站,颜色就15种,你直接one-hot编码15个维度的向量就可以了

Image

      另外比如下图是一个企业级的社交网络简化版,我们就可以通过各个同事之间的关系,来通过one-hot来实现关系的表达

Image

      但是这个东西放微信或者微博里又基本扯淡了,因为上亿用户,所以另一个结论,特征设计,抛开量级不谈即使同一场景也是耍流氓

      由上图也引出了我们今天的内容远近,比如AB和CD究竟谁和谁的关系最好,我们就拿向量的远近来衡量,这个远近就叫做向量距离!

如果两个向量通过距离进行相似度比较,那么以下几条是基本要求:

Image

1-欧氏距离

我们都知道两点之间的距离,线段最短

Image

但是这是针对点来说的,可是我们面对的对象是两个向量做比较,比如:

      

Image

      在这种情况下,我们就需要把两个向量的所有的维度分别做减法,然后进行平方,再做加和做开方,这样的目的是保证欧氏距离不会出现负数,满足基本要求里的非负性

相关推荐

  1. PyQt6入门放弃

    2024-01-19 22:04:03       12 阅读
  2. cka入门放弃

    2024-01-19 22:04:03       30 阅读
  3. Django入门放弃

    2024-01-19 22:04:03       34 阅读
  4. Docker入门放弃

    2024-01-19 22:04:03       12 阅读
  5. 入门放弃之「ClickHouse」

    2024-01-19 22:04:03       46 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-01-19 22:04:03       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-01-19 22:04:03       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-01-19 22:04:03       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-01-19 22:04:03       18 阅读

热门阅读

  1. MySQL 8.0中已过时的选项和变量

    2024-01-19 22:04:03       21 阅读
  2. 鸿蒙使用第三方SO库

    2024-01-19 22:04:03       41 阅读
  3. C++中的引用及指针变量

    2024-01-19 22:04:03       30 阅读
  4. 使用延迟队列处理超时订单

    2024-01-19 22:04:03       35 阅读
  5. 细胞基因完整矩阵转10xGenomics稀疏矩阵文件

    2024-01-19 22:04:03       30 阅读