划分数据集2,详细说明

看完了这个之后划分数据集,训练自己的数据集。-CSDN博客

我再详细说一下自己标注的文件放在什么位置

我发的文件里有这几个文件

在dataset里面有

自己的数据集分为,图片部分和标注文件部分

打开VOCdevkit文件夹

里面有三个文件夹

自己的图片的话,放在JPEGImages

标注的文件:如果是xml格式的话,放在Annotations里,如果是txt格式的话,放在txt里,

我说明一下,比如我有100张图,我对这些图片进行标注了,那么对应的标注文件数量也应该是100个的,大家检查一下,看看自己有没有漏标的之类的东西。

这些文件放在对应的文件夹之后,就可以开始划分了

举个例子

现在我已经把我的图片放在了JPEGImages文件夹里面

如果我的标注文件格式是xml的话,我把标注文件放在Annotations里面

看一下自己图片的格式,去设置xml2txt.py里的参数

看看自己的图片是说明格式的,选择对应的格式

按住shift+鼠标右键点dataset文件夹,选择在终端中打开

这是进入当前文件位置的终端里了,

激活自己的环境        conda activate 自己的环境名字

输入

python xml2txt.py

这时候就是程序在运行了

最下面的一行会出现  

大括号里面的几个就是标注文件里面的类别名称

打开data.yaml

把这几个复制进来

nc后面填的是类别个数,看这里显示了4个名字,我这就填4

接着就是划分数据集了,打开split_data.py

val_sie = 0.1 的意思是验证集占比10%

同理test_size = 0.1就是测试集占比10%

剩余的就是训练集了,就是80%

这里一般都是设置8:1:1

还有就是图片格式了,填自己图片的格式

接着就和刚才操作一样,进入当前文件位置的终端后,进入自己的环境

输入

python split_data.py

 

运行完成后就会显示

你会发现dataset文件夹里多了两个文件夹,

这就是对应划分的数据集了

如果你的标注格式是txt的话,就和刚才的第二步一样,你划分的类别和数量填在data.yaml文件里就可以了

相关推荐

  1. PostgreSQL 数据类型详细说明

    2024-04-25 16:44:07       31 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-25 16:44:07       91 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-25 16:44:07       97 阅读
  3. 在Django里面运行非项目文件

    2024-04-25 16:44:07       78 阅读
  4. Python语言-面向对象

    2024-04-25 16:44:07       88 阅读

热门阅读

  1. 国内知名五款大模型

    2024-04-25 16:44:07       33 阅读
  2. PageHelper实现分页查询

    2024-04-25 16:44:07       38 阅读
  3. MongoDB聚合运算符:$setDifference

    2024-04-25 16:44:07       37 阅读
  4. android 解决webView底部留白问题

    2024-04-25 16:44:07       37 阅读
  5. C语言中的动态内存管理

    2024-04-25 16:44:07       36 阅读
  6. 使用 MediaCodec 在 Android 上进行硬解码

    2024-04-25 16:44:07       32 阅读
  7. uniapp 小程序 多张图片生成海报以及下载海报

    2024-04-25 16:44:07       29 阅读
  8. 代码随想录第34天: 贪心part03

    2024-04-25 16:44:07       35 阅读
  9. 济南软件企业认定标准

    2024-04-25 16:44:07       33 阅读