计算机视觉图像处理
数字图像
数字图像:又称数码图像或数位图像,是二维图像用有限数字数值像素的表示,由数组或矩阵表示。数字图像可以理解为一个二维函数f(x,y),其中×和y是空间(平面)坐标,而在任意坐标处的幅值f称为图像在该点处的强度或灰度。
图像处理,机器视觉,与人工智能的关系
图像处理主要研究二维图像,处理一个图像或一组图像之间的相互转换的过程,包括图像滤波,图像识别,图像分割等问题
计算机视觉主要研究映射到单幅或多幅图像上的三维场景从图像中提取抽象的语义信息,实现图像理解是计算机视觉的终极目标。
人工智能在计算机视觉上的自标就是解决像素值和语义之间关系,主要的问题有图片检测,图片识别,图片分割和图片检索。
常用工具Opencv
OpenCV于1999年由Intel建立;开源发行的跨平台计算机视觉库操作系统:Linux、Windows、Android、MacOS;构成:C函数和少量C++类;
接口:Python、Java、MATLAB等语言opencv是数字图像处理和计算机视觉领域最常见的工具包,是学习,科研,企业项目开发的好帮手。
Opencv安装高级版本
pip install opencv-contrib-python
图像格式
BMP格式Windows系统下的标准位图格式,未经过压缩,一般图像文件会比较大。在很多软件中被广泛应用,
JPEG格式也是应用最广泛的图片格式之一,它采用一种特殊的有损压缩算法,达到较大压缩比(可达到2:1甚至40:1),互联网上最广泛使用的格式
GIF格式不仅可以是一张静止的图片,也可以是动画,并且支持透明背景图像,适用于多种操作系统,“体型”很小,网上很多小动画都是GIF格式。但是其色域不太广,只支持256种颜色
PNG格式与JPG格式类似,压缩比高于GIF,支持图像透明,支持AIpha通道调节图像的透明度,
TIFF格式它的特点是图像格式复杂、存贮信息多,在Mac中广泛使用,非常有利于原稿的复制。很多地方将TIFF格式用于印刷
图像尺寸
图像尺寸:图像尺寸的长度与宽度是以像素为单位的.
像素(pixel):像素是数码影像最基本的单位,每个像素就是一个小点,而不同颜色的点聚集起来就变成一幅动人的照片,灰度像素点数值范围在0到255之间,0表示黑,255表示白,其它值表示处于黑白之间;彩色图用红、绿、蓝三通道的二维矩阵来表示,每个数值也是在0到255之间,0表示相应的基色,而255则代表相应的基色在该像素中取得最大值。
相关参数
分辨率:单位长度中所表达或截取的像素数目。每英寸图像内的像素点数,单位是像素每英寸(PPI)。图像分辨率越高,像素的点密度越高,图像越清晰。
通道数:图像的位深度,是指描述图像中每个pixel数值所占的二进制位数。位深度越大则图像能表示的颜色数就越多色彩越丰富逼真。8位:单通道图像,也就是灰度图,灰度值范围2**8=256 24位 通道3*8=24 32位 通道加透明度Apha通道
颜色空间也称彩色模型(又称彩色空间或彩色系统)它的用途是在某些标准下用通常可
接受的方式对彩色加以说明。
常见的颜色空间:RGB、HSV、HSI、CMYK
HSV颜色空间概念:
HSV(Hue,Saturation,Value)是根据颜色的直观特性由A.R.Smith在1978年创建
的一种颜色空间,这个模型中颜色的参数分别是:色调(H),饱和度(S),明
度。
图像变换
常见的图像变化:包括了图像平移、图像缩放、图像翻转、图像裁剪等常见的方式
图像分割
图像分割是指将图像分成若干具有相似性质的区域的过程,主要有基于值、基于区域、基于边缘、基于聚类、基于图论和基于深度学习的图像分割方法等。图像分割分为语义分割和实例分割。
分割的原则就是使划分后的子图在内部保持相似度最大,而子图之间的相似度保持最小