深度学习学习日记4.13 灰度图 自定义dataset类 dataloader

1.图像分割数据的标签(灰度图的情况)
该图像是灰度图,且只有两种像素值
在这里插入图片描述
该中标签中图像的像素值有五种
在这里插入图片描述
2.在处理灰度图像时,通常会使用 numpy.squeeze() 函数去除可能存在的单通道。虽然灰度图像只有一个通道,但有时候图像数组的形状可能是 (height, width, 1),其中的额外的单通道可能会引起一些问题或不便。
3.自定义的Dataset类中,通常包含三个核心函数:
①__init__() 初始化函数,用于设置数据集的基本属性和参数。通常在这个函数中进行数据集的加载、预处理或其他初始化工作。
②__getitem__() 用于获取数据集中单个样本的函数。这个函数按照索引获取数据集中的样本,并根据需要对样本进行预处理、转换等操作,并返回处理后得样本。这个函数允许通过索引访问数据集中得每个元素,使得数据集可以迭代访问
③__len__()返回数据集得长度
目的 为了将数据处理得更好,并将其准备好以供神经网络进行训练。
通过自定义 Dataset 类,可以实现数据的加载、预处理、转换等操作,以确保数据在输入到神经网络之前处于适当的格式和状态。
自定义 Dataset 类完成了数据处理和准备工作,接着使用 PyTorch 或其他深度学习框架提供的 DataLoader 将数据传递给神经网络模型进行训练。DataLoader 负责对数据进行批处理、随机化和并行化处理,以提高训练效率,并确保模型能够高效地从数据中学习。
4.dataloader
在这里插入图片描述
dataset:只有dataset没有默认值,只需要将之前自定义的dataset实例化,再放到dataloader中即可
batch_size:每次抓牌抓几张
shuffle:打乱与否,值为True的话两次打牌时牌的顺序是不一样。默认为False,但一般用True
num_workers:加载数据时采用单个进程还是多个进程,多进程的话速度相对较快,默认为0(主进程加载)。Windows系统下该值>0会有问题(报错提示:BrokenPipeError)
drop_last:100张牌每次取3张,最后会余下1张,这时剩下的这张牌是舍去还是不舍去。值为True代表舍去这张牌、不取出,False代表要取出该张牌
原文链接:https://blog.csdn.net/m0_57787115/article/details/129721708

最近更新

  1. TCP协议是安全的吗?

    2024-04-14 07:28:03       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-04-14 07:28:03       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-04-14 07:28:03       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-04-14 07:28:03       20 阅读

热门阅读

  1. Spring(三)

    2024-04-14 07:28:03       41 阅读
  2. GNU Autotools 套件详解

    2024-04-14 07:28:03       16 阅读
  3. .net Web Api Post请求传递数据

    2024-04-14 07:28:03       19 阅读
  4. MySQL-流程控制语句

    2024-04-14 07:28:03       14 阅读
  5. C语言每日一题(68)无重复字符的最长字串

    2024-04-14 07:28:03       17 阅读
  6. ubuntu 更新或更改GCC/G++

    2024-04-14 07:28:03       47 阅读
  7. 静态库和动态库

    2024-04-14 07:28:03       22 阅读
  8. 数字图像处理—图像形状特征

    2024-04-14 07:28:03       61 阅读
  9. 在Linux中,解压和删除压缩文件的命令

    2024-04-14 07:28:03       54 阅读
  10. 算力服务器包含哪些业务?

    2024-04-14 07:28:03       33 阅读
  11. 网站如何一定程度上防止ddos和压力测试

    2024-04-14 07:28:03       20 阅读