计算机视觉8 图像增广

图像增广(image augmentation)是通过对训练图像进行一系列随机改变,从而产生相似但又不同的训练样本的技术。

图像增广有以下两个主要作用:

  1. 扩大训练数据集的规模;
  2. 随机改变训练样本可以降低模型对某些属性的依赖,从而提高模型的泛化能力。

例如,通过不同方式裁剪图像,使感兴趣的物体出现在不同位置,可以减轻模型对物体出现位置的依赖性;调整亮度、色彩等因素能降低模型对色彩的敏感度。

一些常见的图像增广方法包括:

  1. 翻转:如左右翻转(通过torchvision.transforms.RandomHorizontalFliptf.image.random_flip_left_right实现)和上下翻转(通过torchvision.transforms.RandomVerticalFliptf.image.random_flip_up_down实现),通常不会改变对象的类别。
  2. 随机裁剪:随机裁剪一个面积为原始面积一定比例(如10%到100%)的区域,该区域的宽高比也在一定范围内随机取值(如0.5到2),然后将该区域的宽度和高度缩放到指定像素(如200像素)。例如,使用torchvision.transforms.RandomResizedCroptf.image.random_crop
  3. 亮度变化:将图像的亮度随机调整为原图亮度的一定比例范围(如50%到150%),可通过torchvision.transforms.ColorJitter中的brightness参数或tf.image.random_brightness实现。
  4. 色调变化:随机更改图像的色调,如使用torchvision.transforms.ColorJitter中的hue参数或tf.image.random_hue
  5. 颜色变化:还可以同时随机更改图像的亮度、对比度、饱和度和色调,创建torchvision.transforms.ColorJitter实例并设置相应参数即可。
  6. 组合多种方法:可以使用torchvision.transforms.Compose将多个图像增广方法组合起来应用到图像上。

在实践中,通常仅在训练样本上进行图像增广,而在预测过程中不使用随机操作的图像增广,以获得确切的结果。

相关推荐

  1. 计算机视觉8 图像广

    2024-07-19 12:36:04       17 阅读
  2. 视觉图像面积计算

    2024-07-19 12:36:04       15 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-19 12:36:04       70 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-19 12:36:04       74 阅读
  3. 在Django里面运行非项目文件

    2024-07-19 12:36:04       62 阅读
  4. Python语言-面向对象

    2024-07-19 12:36:04       72 阅读

热门阅读

  1. Linux输出重定向详解

    2024-07-19 12:36:04       18 阅读
  2. ArduPilot开源代码之AP_DAL_RangeFinder

    2024-07-19 12:36:04       17 阅读
  3. 可视化页面LandingPage如何修改组件的内容 - Modstart

    2024-07-19 12:36:04       20 阅读
  4. 【SpringBoot】Controller与Test

    2024-07-19 12:36:04       18 阅读
  5. WPF之URI的使用

    2024-07-19 12:36:04       24 阅读
  6. oracle显示列名,列注释

    2024-07-19 12:36:04       19 阅读
  7. vite+vue3项目初始化搭建

    2024-07-19 12:36:04       15 阅读
  8. wsdl接口返回xml数据接收

    2024-07-19 12:36:04       18 阅读
  9. CSAPP看了快半年了

    2024-07-19 12:36:04       18 阅读
  10. STM32中volatile关键字

    2024-07-19 12:36:04       18 阅读
  11. 最长公共子序列和最长公共子串模板(LCS)

    2024-07-19 12:36:04       22 阅读
  12. Nginx:常规配置参考

    2024-07-19 12:36:04       19 阅读