机器学习笔记 - 基于pytorch的自定义数据集和数据加载器

         PyTorch 提供了torch.utils.data.DataLoadertorch.utils.data.Dataset 允许您使用预加载的数据集以及您自己的数据。 Dataset存储样本及其相应的标签,并基于DataLoader进行迭代Dataset以访问样本。

        自定义 Dataset 类必须实现三个函数:__init__、__len__和__getitem__。

        下面的代码,是基于voc格式的目标检测的数据集编写的。

        __init__函数里面定义了基本信息,我们可以看到有路径、图像宽高、分类信息、图像后缀等,主要的是所有图像的路径信息的集合。

        __len__最简单,就是所有的图像的数量。

        __getitem__是根据给定索引找到图像,进行处理,并继续找到对应目标检测的xml文件,读取解析里面的坐标信息等

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-30 00:42:06       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-30 00:42:06       100 阅读
  3. 在Django里面运行非项目文件

    2024-04-30 00:42:06       82 阅读
  4. Python语言-面向对象

    2024-04-30 00:42:06       91 阅读

热门阅读

  1. MySQL的备份与恢复

    2024-04-30 00:42:06       25 阅读
  2. sqlserver创建login、user并授予相应数据库的权限

    2024-04-30 00:42:06       30 阅读
  3. 使用python写一个识别车牌原理

    2024-04-30 00:42:06       30 阅读
  4. ssh登录主机时会读取哪些PAM文件进行认证

    2024-04-30 00:42:06       36 阅读
  5. 【QA】Git常用命令

    2024-04-30 00:42:06       27 阅读
  6. Zookeeper集群部署和单机部署

    2024-04-30 00:42:06       31 阅读
  7. c# 字典与内存碎片化

    2024-04-30 00:42:06       30 阅读
  8. 第三部分 Vue讲解(22-25)(代码版)

    2024-04-30 00:42:06       22 阅读
  9. 启动前端项目

    2024-04-30 00:42:06       29 阅读