计算机视觉图像处理理论基础

2024-06-06 16:30:06
开发
10

计算机视觉图像处理

数字图像

数字图像：又称数码图像或数位图像，是二维图像用有限数字数值像素的表示，由数组或矩阵表示。数字图像可以理解为一个二维函数f(x,y)，其中×和y是空间（平面）坐标，而在任意坐标处的幅值f称为图像在该点处的强度或灰度。

图像处理，机器视觉，与人工智能的关系

图像处理主要研究二维图像，处理一个图像或一组图像之间的相互转换的过程，包括图像滤波，图像识别，图像分割等问题

计算机视觉主要研究映射到单幅或多幅图像上的三维场景从图像中提取抽象的语义信息，实现图像理解是计算机视觉的终极目标。

人工智能在计算机视觉上的自标就是解决像素值和语义之间关系，主要的问题有图片检测，图片识别，图片分割和图片检索。

常用工具Opencv

OpenCV于1999年由Intel建立；开源发行的跨平台计算机视觉库操作系统：Linux、Windows、Android、MacOS；构成：C函数和少量C++类；
接口：Python、Java、MATLAB等语言opencv是数字图像处理和计算机视觉领域最常见的工具包，是学习，科研，企业项目开发的好帮手。

Opencv安装高级版本
pip install opencv-contrib-python

图像格式

BMP格式Windows系统下的标准位图格式,未经过压缩，一般图像文件会比较大。在很多软件中被广泛应用，
JPEG格式也是应用最广泛的图片格式之一，它采用一种特殊的有损压缩算法，达到较大压缩比（可达到2：1甚至40：1），互联网上最广泛使用的格式
GIF格式不仅可以是一张静止的图片，也可以是动画，并且支持透明背景图像，适用于多种操作系统，“体型”很小，网上很多小动画都是GIF格式。但是其色域不太广，只支持256种颜色
PNG格式与JPG格式类似，压缩比高于GIF，支持图像透明，支持AIpha通道调节图像的透明度，
TIFF格式它的特点是图像格式复杂、存贮信息多，在Mac中广泛使用，非常有利于原稿的复制。很多地方将TIFF格式用于印刷

图像尺寸

图像尺寸：图像尺寸的长度与宽度是以像素为单位的.

像素（pixel）:像素是数码影像最基本的单位，每个像素就是一个小点，而不同颜色的点聚集起来就变成一幅动人的照片，灰度像素点数值范围在0到255之间，0表示黑，255表示白，其它值表示处于黑白之间；彩色图用红、绿、蓝三通道的二维矩阵来表示，每个数值也是在0到255之间，0表示相应的基色，而255则代表相应的基色在该像素中取得最大值。

图像变换

常见的图像变化：包括了图像平移、图像缩放、图像翻转、图像裁剪等常见的方式

图像分割

图像分割是指将图像分成若干具有相似性质的区域的过程，主要有基于值、基于区域、基于边缘、基于聚类、基于图论和基于深度学习的图像分割方法等。图像分割分为语义分割和实例分割。

在这里插入图片描述

分割的原则就是使划分后的子图在内部保持相似度最大，而子图之间的相似度保持最小

原文地址:https://blog.csdn.net/weixin_46167190/article/details/139334639 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1798633450199191552.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

计算机视觉图像处理理论基础