5.卷积神经网络

1.从全连接到卷积

分类猫和狗的图片

  • 使用一个相机采集图片(12000=12M像素)
  • RGB图片有36000=36M像素
  • 使用100大小的单隐藏层MLP,模型有36亿=3.6B元素
    • 远多于世界上所有猫和狗总数

回顾:单隐藏测MLP(多层感知机=全连接层)

  • 根据36M像素通过100的全连接层 参数就变为3.6B = 14GB
  • 这样是太大的,不可能的

假设我们想从一张图片中找到某个物体。 合理的假设是:无论哪种方法找到这个物体,都应该和物体的位置无关。 理想情况下,我们的系统应该能够利用常识:猪通常不在天上飞,飞机通常不在水里游泳。

总结上面在图片中目标定位有两个原则

  • 平移不变性(translation invariance):不管检测对象出现在图像中的哪个位置,神经网络的前面几层应该对相同的图像区域具有相似的反应,即为“平移不变性”。
  • 局部性(locality):神经网络的前面几层应该只探索输入图像中的局部区域,而不过度在意图像中相隔较远区域的关系,这就是“局部性”原则。最终,可以聚合这些局部特征,以在整个图像级别进行预测。

总结

  • 对全连接层使用平移不变性和局部性得到卷积层

相关推荐

  1. 5.神经网络

    2024-06-19 08:32:04       7 阅读
  2. 神经网络

    2024-06-19 08:32:04       23 阅读
  3. 神经网络

    2024-06-19 08:32:04       13 阅读
  4. 神经网络

    2024-06-19 08:32:04       7 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-06-19 08:32:04       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-19 08:32:04       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-19 08:32:04       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-19 08:32:04       18 阅读

热门阅读

  1. 医疗图像的校准

    2024-06-19 08:32:04       5 阅读
  2. [python学习]--模块管理

    2024-06-19 08:32:04       8 阅读
  3. 解析方法与几何模型

    2024-06-19 08:32:04       10 阅读
  4. 【Leetcode】最后一个单词的长度

    2024-06-19 08:32:04       8 阅读
  5. sqlalchemy读取日志数据并保存至数据库

    2024-06-19 08:32:04       7 阅读
  6. 经典sql

    经典sql

    2024-06-19 08:32:04      8 阅读
  7. 硬盘的缓存有什么作用

    2024-06-19 08:32:04       7 阅读
  8. PHP框架详解-symfony框架

    2024-06-19 08:32:04       9 阅读
  9. vue实现点击元素跳转至另一个网站

    2024-06-19 08:32:04       7 阅读
  10. R语言数据分析案例:探索在线零售数据集

    2024-06-19 08:32:04       6 阅读
  11. state和store的使用场景

    2024-06-19 08:32:04       10 阅读
  12. 判断素数的方法

    2024-06-19 08:32:04       5 阅读