影响视频视觉质量的因素——各类视觉伪影

模糊效应(Blurring Artifact)

图像模糊(blurring):平滑图像的细节和边缘产生的现象,模糊对于图像来说,是一个低通滤波器(low-pass filter)。一般而言,用户更趋向于获取更清晰的图像,因此会极力避免模糊的产生。但有时候会使用高斯模糊(gaussian blurring)来降低图像噪点或者增强图像在不同比例大小下的图像效果。通常,模糊会作为压缩之前的预处理操作,从而减少图像的高频信号来产生更有效的压缩。另外,边缘检测对于环境噪点非常敏感,因此,模糊在边缘检测算法中也很有用。
在这里插入图片描述
频率从左到右线性增加的单色光栅
在这里插入图片描述
对如上的单色光栅的高斯模糊效果
图1 一个模糊频率斜坡(frequency ramp)示意图

上述图中可看到,对于左边的低频率信号,模糊几乎没有任何影响,但是对右边的高频率信息,高斯模糊则由很明显的效果

运动模糊
运动模糊:长时间暴光或场景内的物体快速移动的情况下出现的伪影。摄影机的工作原理是在很短的时间里把场景在胶片上暴光(场景中的光线投射在胶片上,引起化学反应,最终产生图片)。如果在暴光的过程中,场景发生变化,则就会产生模糊的画面。
对于体育题材的视频内容,运动模糊会引起不适,导致运动员在慢动作的场景下,无法确认其准确位置,对比赛场景中不友好。这种情况下,下采用平移相机以跟踪移动物体可保持运动物体清晰但背景是模糊的。图形、图像或视频编辑工具可能出于艺术原因需产生运动模糊效果。当添加计算机生成的图像(CGI, computed generated imagery)到视频镜头时,会频繁的合成运动模糊从而模拟真实世界中存在的模糊或表现运动物体的速度感。在这里插入图片描述
图2 运动模糊的例子

显示器的隔行扫描和电视电影处理可能会导致运动速度的不规则。另外,对于快速运动的物体,数字视频中的压缩失真(compression artifacts)也会带来额外的模糊。 LCD固有的采样-保持(sample-and-hold)工作模式与人眼跟踪效应的综合效果决定了LCD在显示运动画面时会存在运动模糊。对于LCD显示器而言,运动模糊是一个较为严重的问题。这种情况,通常是通过控制背光减少运动模糊的影响。

块效应(Block Boundary Artifact)
所有视频、图像编码标准中基于块的有损编码方案,若以较低的码率编码图像块的边缘像素就会在块的边缘处引入可见的伪像
在基于块的变换编码中,使用DCT或类似的变换将像素块映射到频域空间,并且在量化过程中会丢弃高频系数。码率越低,对编码块的量化越粗糙,从而产生模糊的、低分辨率的图像块。在极端情况下,编码块只剩下代表数据平均值的DC系数,因此对该编码块的重建图像只是一个单色区域。

块效应伪像是对各图像块进行独立量化变换系数的结果,相邻的图像块分别量化系数,从而导致重构图像块的边界不连续。图像块边界的不连续性通常是可见的,尤其是在天空,人脸等平坦的颜色区域中。平坦的颜色区域中几乎没有任何细节可以掩盖图像块边界的不连续性,视频编码算法使用去块(deblocking)滤波以平滑重构的块边界

在这里插入图片描述
原始图像
在这里插入图片描述
重构后明显的块效应伪像的图像
图3 块边界效应伪像的例子

振铃效应(Ringing Artifact)

振铃:输入图像中的像素值剧烈变化导致输出图像在灰度剧烈变化处或轮廓处产生的震荡而导致的重影或回声效果,就好像钟被敲击后产生的空气震荡一样。图像处理中,需要对图像进行滤波处理,若选用的频域滤波器具有陡峭的变化,滤波图像就会产生振铃。振铃是由于众所周知的吉布斯(Gibb‘s)现象引起的,即滤波器在不连续点附近的脉冲响应的振荡行为,其中输出的比相应的输入值高(overshoots, higher value)或小(undershoots, lower value),并且幅度(magnitude)不断减小直到达到稳态为止,输出信号以渐弱的频率振荡,图4给出了一个振铃效应的例子。
在这里插入图片描述
图4 吉布斯现象的振铃输出
在这里插入图片描述
原始图像
在这里插入图片描述
包含振铃伪像的图像
图5. 振铃伪像的例子

混叠效应(Aliasing Artifacts)
连续信号x(t)及其采样信号x(n),x(n)=x(nT),采样周期T>0。当x(n)为2倍的下采样时,丢弃其他所有信号值。在频率(ω)域中,信号 X(ejw)的傅立叶变换被扩展了2倍。在这种情况下,变换后的信号会与其移位后的副本重叠。这样,无法从其下采样版本中恢复原始信号,因为重叠区域同时代表了转换信号的两个副本,这种重叠的效果称为混叠。
在这里插入图片描述
图6. 变换域的下采样导致的混叠效应

混叠是指重构抽样信号数值的不确定而导致的伪影或失真。混叠可能发生在实时采样信号中,例如数字音频,称为时间混叠。混叠发生在空间采样信号(例如,数字图像或视频时称为空间混叠。
在采样有限持续时间的自然信号时,总会发生混叠。因为采样函数的频率内容没有上限,导致它们的傅立叶变换表示始终与其他变换函数重叠。另一方面,具有受限频率内容(带宽受限)的函数具有无限的持续时间。如果以高于奈奎斯特采样率的速度采样,则原始信号就可以从采样信号中完全恢复。
从图6可明显看出,如果将原始信号限制在∣ω∣< M/π,其中M是下采样倍数。在这种情况下,可以使用上采样器从下采样的版本中恢复原始信号,然后进行滤波。
上采样(L=2),又称为信号插值,即在原信号序列x(n)的两个点之间插入L个0,等效于在其频域上做了频谱压缩。下采样(M=2)又称为信号抽取,即在原信号序列x(n)中每隔M个点抽取一个点,等效于在其频域上做了频谱扩展

锯齿效应(Jaggies)
锯齿(jaggies)属于一种常见的混叠伪影,在数字图像中的平滑直线或曲线上产生可见的阶梯状线条。阶梯或台阶是像素规则的、正方形布局的结果,随着图像分辨率的提高,该伪像会变得越不可见。抗锯齿(anti-aliasing)滤镜可用于减少锯齿边缘的可见性,而锐化(sharpening)会提高这种可见性。
在这里插入图片描述
图7. 混叠伪影的例子

摩尔纹(Moire pattern)
由于精细的常规图案的下采样,出现了莫尔纹的混叠现象,摩尔纹是各种数字成像和计算机图形技术产生的图像中不希望存在的伪像。摩尔效果是明显不同的视觉感知,这是由两个相似图案的不精确叠加引起的。在图7中,摩尔效果可看成起伏的图案,而原始图案则包括紧密间隔的直线网格。

闪烁效应(Flickering Artifacts)
视频显示足够长时间内(例如,大约100毫秒),察觉到亮度中断现象,称之为闪烁。是一种令人不悦的闪光效果,当以较低的刷新率驱动旧显示器时(例如CRT,阴极射线管),就会发生闪烁现象。由于液晶显示器(LCD)中,用于每个像素的快门保持稳定的不透明性,因此即使刷新图像也不会闪烁。

抖动(Jerkiness)
抖动是一种类似闪烁的伪像,描述了对视频中的单个静止图像的感知。 感觉到闪烁和抖动的频率取决于许多条件,包括环境及照明条件。对于24 fps或更高帧率正常播放视频而言,无法感知到抖动。视觉通信系统中,如果解码器延迟导致视频解码器丢弃视频帧,或由于网络错误导致解码失败,此时将继续显示前一帧,直到成功解码下一个无错误帧,显示屏上的场景才会突然更新,此时就会观察到抖动现象

电视电影转换抖动(Telecine Judder)
电视电影转换抖动是另一种类似闪烁的伪像。24 fps电影转换为30fps视频时,需做电视电影转换(telecine)或采用2:3的下拉(pulldown),此技术是将每四帧电影帧转换为五帧隔行扫描的视频帧。DVD、蓝光播放器或录像机会检测到电视电影的转换,并应用反向电视电影转换过程重建原始的24fps的视频内容。

在这里插入图片描述
图8. 电视电影转换过程

电视电影转换处理创建了两个新的帧 B/C和C/D,与原始胶卷相比,电视电影处理会在视频信号中产生少量的错误。影响在NTSC制式的电视上观看电影时的体验,电影看起来不像在电影院中观看时,那样平滑。尤其是在相机缓慢、稳定的运动时,该问题尤为明显。

其它图像伪像(Other Image Artifacts)

在压缩视频中,还有其它的可视误差,下面对其简单介绍。
在这里插入图片描述
图9.各种图像噪声的示例

(1)传输错误导致的数据损坏
视频比特流的传输错误,在重建信号时会产生数据损坏,传输错误有时会导致解码或解码的图像存在丢失块。严重传输错误情况下,解码器在短时间内继续对损坏的图片进行更新,从而产生重影图像效果(ghost image effect),重影效果会一直持续到下一个无错误的关键帧为止。在露天电视信号中,重影是一种比较常见的效果。

(2)图像噪声
相机传感器包含一个或多个光敏光电二极管,将入射光转换成电信号,电信号被处理成图像的像素颜色值。但这个过程并不总是完全可重复的,并且会存在一些统计差异。即使没有入射光,传感器的电活动也可能产生一些信号,图像噪声来源于这些非期望的信号和差异。这种噪声随每个像素和时间而变化,并随温度而增加。
胶片颗粒也会导致图像噪声,数字图像中的噪声在均匀表面中最明显,例如在天空和阴影中的单色颗粒和彩色波。热像素噪声是另一种类型的噪声。热像素噪声因为持续一秒以上的长时间曝光而出现,并且显示为略大于单个像素的彩色点。不过现代相机中,热像素噪声越来越少。

最近更新

  1. TCP协议是安全的吗?

    2024-05-10 06:36:03       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-05-10 06:36:03       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-05-10 06:36:03       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-05-10 06:36:03       18 阅读

热门阅读

  1. 【VLAN聚合和MUX VLAN的配置总结】

    2024-05-10 06:36:03       12 阅读
  2. 【LinuxC语言】信号的基本概念与基本使用

    2024-05-10 06:36:03       12 阅读
  3. 力扣经典150题第五十五题:逆波兰表达式求值

    2024-05-10 06:36:03       14 阅读
  4. 大数据技术概述_2.大数据面临的5个方面的挑战

    2024-05-10 06:36:03       13 阅读
  5. AIGC笔记--Diffuser的训练pipeline

    2024-05-10 06:36:03       14 阅读
  6. 标准库bind函数

    2024-05-10 06:36:03       9 阅读
  7. win7下安装python,matplotlib,numpy

    2024-05-10 06:36:03       11 阅读
  8. 如何利用AI提高内容生产效率?

    2024-05-10 06:36:03       10 阅读
  9. 揭秘:深度学习与自然语言处理的本质差异

    2024-05-10 06:36:03       11 阅读
  10. HTTP协议:通信机制、特点及实践应用

    2024-05-10 06:36:03       12 阅读