深度学习-4-PyTorch中的数据加载器Dataset和DataLoader

参考Pytorch的torch.utils.data中Dataset以及DataLoader等详解

在我们进行深度学习的过程中,不免要用到数据集,那么数据集是如何加载到我们的模型中进行训练的呢?

1 模块torch.utils.data

torch.utils.data是PyTorch提供的一个模块,用于处理和加载数据。
该模块提供了一系列工具类和函数,用于创建、操作和批量加载数据集。
下面是torch.utils.data模块中一些常用的类和函数:
(1)Dataset: 定义了抽象的数据集类,用户可以通过继承该类来构建自己的数据集。Dataset 类提供了两个必须实现的方法【下划线getitem下划线】 用于访问单个样本,【下划线len下划线】用于返回数据集的大小。
(2)TensorDataset: 继承自Dataset类,用于将张量数据打包成数据集。它接受多个张量作为输入,并按照第一个输入张量的大小来确定数据集的大小。
(3)DataLoader: 数据加载器类,用于批量加载数据集。它接受一个数据集对象作为输入,并提供多种数据加载和预处理的功能,如设置批量大小、多线程数据加载和数据打乱等。
(4)Subset: 数据集的子集类,用于从数据集中选择指定的样本。
(5)random_split: 将一个数据集随机划分为多个子集,可以指定划分的比例或指定每个子集的大小。
(6)ConcatDataset

相关推荐

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-14 18:18:02       67 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-14 18:18:02       72 阅读
  3. 在Django里面运行非项目文件

    2024-07-14 18:18:02       58 阅读
  4. Python语言-面向对象

    2024-07-14 18:18:02       69 阅读

热门阅读

  1. defineProps和defineEmits

    2024-07-14 18:18:02       18 阅读
  2. 常见排序算法

    2024-07-14 18:18:02       15 阅读
  3. 高阶面试-mongodb

    2024-07-14 18:18:02       17 阅读
  4. 【无标题】

    2024-07-14 18:18:02       19 阅读
  5. Apache Kylin: 大数据时代的分析引擎

    2024-07-14 18:18:02       20 阅读
  6. 异步和线程池

    2024-07-14 18:18:02       20 阅读
  7. Go:常量&运算符&流程控制

    2024-07-14 18:18:02       16 阅读
  8. qiankun子应用vue加载js资源失效问题解决

    2024-07-14 18:18:02       18 阅读
  9. 深入理解C++11中的std::packaged_task

    2024-07-14 18:18:02       21 阅读