数据集配置

1.1、一般有两种分类:训练集/测试集,或者 训练集/验证集/测试集,前者用训练集来训练,用测试集来验证。如果不理想,就重新训练。 后者用验证集来验证和重新训练,然后再跑测试集,但是测试集如果不理想,有时也会重新训练。 故很多人索性就选择用两层。

当样本较少时,往往采用7/3、/6/2/2分配。但是数据量大有的采用99/1分配,甚至99.5/0.5/0.1分配,因为此时0.1的比例,就可能有上千条数据了。

1.2、尽量要保证:训练数据集、验证数据集、测试数据集的来源一致。比如训练集图片像素很高,而验证集图片像素很低,则训练不出优秀的网络。

1.3、切勿对测试集进行训练!当测试数据集的准确率非常高了,就有必要怀疑是否对测试数据做了训练(测试数据中存在和训练数据相同的样本)

相关推荐

  1. 数据配置

    2024-07-16 00:42:06       21 阅读
  2. Redis - 多数据配置

    2024-07-16 00:42:06       44 阅读
  3. Yolov10环境配置+训练自己数据(Windows10)

    2024-07-16 00:42:06       24 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-16 00:42:06       67 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-16 00:42:06       72 阅读
  3. 在Django里面运行非项目文件

    2024-07-16 00:42:06       58 阅读
  4. Python语言-面向对象

    2024-07-16 00:42:06       69 阅读

热门阅读

  1. windows区分大小写

    2024-07-16 00:42:06       23 阅读
  2. BCC工具命令报错解决步骤

    2024-07-16 00:42:06       21 阅读
  3. React

    React

    2024-07-16 00:42:06      19 阅读
  4. zookeeper+kafka消息队列群集部署

    2024-07-16 00:42:06       18 阅读
  5. MySQL架构详解

    2024-07-16 00:42:06       19 阅读
  6. 食品安全管理员考试真题题库及答案

    2024-07-16 00:42:06       19 阅读
  7. WPF TreeView 全选/反选/子级选中父级也选中

    2024-07-16 00:42:06       18 阅读
  8. 基于深度学习的文本摘要

    2024-07-16 00:42:06       22 阅读
  9. 基于深度学习的语音识别

    2024-07-16 00:42:06       24 阅读
  10. Ubuntu20.04.6新系统没有wifi驱动(已解决)

    2024-07-16 00:42:06       24 阅读