Opencv计算机视觉的分类

传统的计算机视觉可以使用Opencv等Python库,对图像进行简单的操作,例如对图像缩放、滤波、阈值分割等等。对于计算机来说,一张彩色图片就是一个三通道的矩阵,分别对应红绿蓝(RGB)三种颜色,通过改变颜色的数值(0-255)来显示出一张完整的彩色图片,传统的计算机视觉就是围绕这一个三维矩阵,比如设置一个颜色区间,进行过滤等等操作。

这一类视觉处理的方法,功能相对较弱一些,能够处理一些简单的应用场景,比如识别绿色物体,识别动态的物体等。但是对于背景复杂的实际场景中,很多问题都难以解决。

推荐Opencv教程地址:GitHub - CodecWang/opencv-python-tutorial: 📖 OpenCV-Python image processing tutorial for beginners

深度学习

通过人工智能对图像进行处理的算法有很多,其中最为经典的为卷积神经网络,对原始图像不停卷积运算,充分提取特征,最后输出想要的结果,这类方法经过实践的验证取得了非常不错的精度表现,在目前的很多硬件上,都能够跑出实时的效果。

当然,更多新型的视觉处理算法也涌现出来,比如最近比较火热的Transformer算法,最初应用于NLP(自然语言处理),最近科研者们发现它在视觉领域也展现出了非常不错的表现,很多领域下都取得了最佳的精度,突破了卷积神经网络的精度瓶颈。我们这期教程还是围绕卷积神经网络,这种经典的算法展开,仍然值得大家深入地学习。

计算机视觉任务的分类

分类(Classification)

分类任务是对整张图片进行分类,例如最为经典的猫狗分类。

猫狗分类就是让计算机对于我指定的图片进行归类,如果这张图片是猫,我把图片输入到模型后,我期望输出的就是猫这个类别。可以看到,分类任务是对整张图片的归类,如果一张图片里面既有猫,又有狗,那么显然分类无法完成,因为分类任务是不需要对物体定位的。分类任务是计算机视觉最简单的任务,实现的难度最低,当然功能也最为简单。

检测(Detection)

检测任务相对于分类任务,需要精确地对图像中的目标物体定位,一般用矩形框确定目标位置。如上图,一张图片中,有狗,有自行车,有汽车,对于检测任务,就需要精确地框出他们的位置,并判别类别。检测任务是对图像中的物体进行特征识别,相比分类任务难度有所提升,也是我们经常会有的需求,需要精确判定特征物体在画面中的位置,例如行人检测,人脸检测等等。

分割(Segmentation)

分割任务的难度再次增加,任务要求不仅需要确定位置,还需要勾勒出物体的轮廓,类似PS的抠图,过滤去背景。例如上图所示的工业读表,车道线分割等等,这类任务对于模型和算法的考验较大,在特定的场合中有一定的应用。

相关推荐

  1. OpenCV计算机视觉领域瑞士军刀

    2023-12-23 14:56:02       27 阅读
  2. OpenCV计算机视觉应用

    2023-12-23 14:56:02       12 阅读
  3. OpenCV-计算机视觉开发

    2023-12-23 14:56:02       32 阅读

最近更新

  1. TCP协议是安全的吗?

    2023-12-23 14:56:02       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2023-12-23 14:56:02       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2023-12-23 14:56:02       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2023-12-23 14:56:02       18 阅读

热门阅读

  1. mybatis xml 文件 sql include 的用法

    2023-12-23 14:56:02       39 阅读
  2. 使用xuggle_5.4 实现视频加水印

    2023-12-23 14:56:02       39 阅读
  3. mockito-study-api

    2023-12-23 14:56:02       37 阅读
  4. Mac[M1]安装mongodb

    2023-12-23 14:56:02       34 阅读
  5. 掌握 Rust 中的建造者模式

    2023-12-23 14:56:02       47 阅读
  6. Harmonyos系统使用http访问网络和应用数据管理

    2023-12-23 14:56:02       31 阅读
  7. 数据处理演进:EtLT崛起,ELT正在告别历史舞台

    2023-12-23 14:56:02       34 阅读
  8. Golang leetcode59 螺旋矩阵

    2023-12-23 14:56:02       35 阅读
  9. 基于汉宁窗FIR滤波器实现语音信号加噪去噪

    2023-12-23 14:56:02       41 阅读
  10. MySQL数据库

    2023-12-23 14:56:02       32 阅读
  11. 理解计算机中的中断与中断处理

    2023-12-23 14:56:02       46 阅读
  12. log4j rename方法

    2023-12-23 14:56:02       36 阅读
  13. python使用selenium无法获取frame完整内容的问题

    2023-12-23 14:56:02       45 阅读