YOLOv8参数详解

1.训练参数

YOLOv8的全部参数表在 train -Ultralytics YOLOv8 文档 

Key 默认值 Description
model None 指定用于训练的模型文件。接受指向 .pt 预训练模型或 .yaml 配置文件。对于定义模型结构或初始化权重至关重要。
data None 数据集配置文件的路径(例如 coco128.yaml).该文件包含特定于数据集的参数,包括训练数据和验证数据的路径、类名和类数。
epochs 100 训练历元总数。每个历元代表对整个数据集进行一次完整的训练。调整该值会影响训练时间和模型性能.
time None 最长训练时间(小时)。如果设置了该值,则会覆盖 epochs 参数,允许训练在指定的持续时间后自动停止。对于时间有限的训练场景非常有用
patience 100 在验证指标没有改善的情况下,提前停止训练所需的轮数。当性能趋于平稳时停止训练,有助于防止过度拟合。
batch 16 训练的批量大小,表示在更新模型内部参数之前要处理多少张图像。自动批处理 (batch=-1)会根据 GPU 内存可用性动态调整批处理大小。
imgsz 640 用于训练的目标图像尺寸。所有图像在输入模型前都会被调整到这一尺寸。影响模型精度和计算复杂度。
save True 可保存训练检查点和最终模型权重。这对恢复训练或模型部署非常有用。
save_period -1 保存模型检查点的频率,以 epochs 为单位。值为-1 时将禁用此功能。该功能适用于在长时间训练过程中保存临时模型。
cache False 在内存中缓存数据集图像 (True/ram)、磁盘 (disk),或禁用它 (False).通过减少磁盘 I/O 提高训练速度,但代价是增加内存使用量
device None 指定用于训练的计算设备:单个 GPU (device=0)、多个 GPU (device=0,1)、CPU (device=cpu),或苹果芯片的 MPS (device=mps).
workers 8 加载数据的工作线程数(每 RANK 多 GPU 训练)。影响数据预处理和输入模型的速度,尤其适用于多 GPU 设置。一般在windows中设置为 0
project None 保存训练结果的项目目录名称。允许有组织地存储不同的实验
name None 训练运行的名称。用于在project文件夹内创建一个子目录,用于存储训练日志和输出结果。project/name
exist_ok False 如果为 True,则允许覆盖现有的项目/名称目录。这对迭代实验非常有用,无需手动清除之前的输出.
pretrained True 决定是否从预处理模型开始训练。可以是布尔值,也可以是加载权重的特定模型的字符串路径。提高训练效率和模型性能。
optimizer auto 为训练选择优化器。选项包括 SGDAdamAdamWNAdamRAdamRMSProp 等,或 auto 用于根据模型配置进行自动选择。影响收敛速度和稳定性
verbose False 在训练过程中启用冗长输出,提供详细日志和进度更新。有助于调试和密切监控培训过程。
seed 0 为训练设置随机种子,确保在相同配置下运行的结果具有可重复性
deterministic True 强制使用确定性算法,确保可重复性,但由于对非确定性算法的限制,可能会影响性能和速度。
single_cls False 在训练过程中将多类数据集中的所有类别视为单一类别。适用于二元分类任务,或侧重于对象的存在而非分类。如果设置为 True,将会将多类数据视为单一类别进行训练。
rect False 可进行矩形训练,优化批次组成以减少填充。这可以提高效率和速度,但可能会影响模型的准确性
cos_lr False 利用余弦学习率调度器,根据历时的余弦曲线调整学习率。这有助于管理学习率,实现更好的收敛。
close_mosaic 10 在训练完成前禁用最后 N 个轮次的马赛克数据增强以稳定训练。设置为 0 则禁用此功能。
resume False 从上次保存的检查点恢复训练。自动加载模型权重、优化器状态和历时计数,无缝继续训练。
amp True 启用自动混合精度 (AMP) 训练,可减少内存使用量并加快训练速度,同时将对精度的影响降至最低。
fraction 1.0 指定用于训练的数据集的部分。允许在完整数据集的子集上进行训练,这对实验或资源有限的情况非常有用。
profile False 在训练过程中,可对ONNX 和TensorRT 速度进行剖析,有助于优化模型部署
freeze None 冻结模型的前 N 层或按索引指定的层,从而减少可训练参数的数量。这对微调或迁移学习非常有用。
lr0 0.01 初始学习率(即 SGD=1E-2Adam=1E-3) .调整这个值对优化过程至关重要,会影响模型权重的更新速度
lrf 0.01 最终学习率占初始学习率的百分比 = (lr0 * lrf),与调度程序结合使用,随着时间的推移调整学习率。
momentum 0.937 用于 SGD 的动量因子,或用于 Adam 优化器的 beta1,用于将过去的梯度纳入当前更新
weight_decay 0.0005 L2 正则化项,对大权重进行惩罚,以防止过度拟合。
warmup_epochs 3.0 学习率预热的历元数,学习率从低值逐渐增加到初始学习率,以在早期稳定训练
warmup_momentum 0.8 热身阶段的初始动力,在热身期间逐渐调整到设定动力。
warmup_bias_lr 0.1 热身阶段的偏置参数学习率,有助于稳定初始历元的模型训练。
box 7.5 损失函数中边框损失部分的权重,影响对准确预测边框坐标的重视程度。
cls 0.5 分类损失在总损失函数中的权重,影响正确分类预测相对于其他部分的重要性。
dfl 1.5 分布焦点损失权重,在某些YOLO 版本中用于精细分类。
pose 12.0 姿态损失在姿态估计模型中的权重,影响准确预测姿态关键点的重点。
kobj 2.0 姿态估计模型中关键点对象性损失的权重,在检测可信度和姿态精度之间取得平衡。
label_smoothing 0.0 应用标签平滑,将硬标签软化为目标标签和标签均匀分布的混合标签,可以提高泛化效果
nbs 64 用于损耗正常化的标称批量大小
overlap_mask True 决定在训练过程中分割掩码是否应该重叠,适用于实例分割任务。
mask_ratio 4 分割掩码的下采样率,影响训练时使用的掩码分辨率
dropout 0.0 分类任务中正则化的放弃率,通过在训练过程中随机省略单元来防止过拟合
val True 可在训练过程中进行验证,以便在单独的数据集上对模型性能进行定期评估。
plots False 生成并保存训练和验证指标图以及预测示例图,以便直观地了解模型性能和学习进度。

2.验证参数

Key 类型 默认值 Description
data str None 指定数据集配置文件的路径(如 coco128.yaml).该文件包括验证数据的路径、类名和类数。
imgsz int 640 定义输入图像的尺寸。所有图像在处理前都会调整到这一尺寸。
batch int 16 设置每批图像的数量。使用 -1 的自动批处理功能,可根据 GPU 内存可用性自动调整。
save_json bool False 如果 True此外,还可将结果保存到 JSON 文件中,以便进一步分析或与其他工具集成。
save_hybrid bool False 如果 True,保存混合版本的标签,将原始注释与额外的模型预测相结合。
conf float 0.001 设置检测的最小置信度阈值。置信度低于此阈值的检测将被丢弃。
iou float 0.6 设置非最大抑制 (NMS) 的交叉重叠 (IoU) 阈值。有助于减少重复检测。
max_det int 300 限制每幅图像的最大检测次数。在密度较高的场景中非常有用,可以防止检测次数过多。
half bool True 可进行半精度(FP16)计算,减少内存使用量,在提高速度的同时,将对精度的影响降至最低。
device str None 指定验证设备 (cpucuda:0等)。可灵活利用 CPU 或 GPU 资源。
dnn bool False 如果 True它使用 OpenCV DNN 模块进行ONNX 模型推断,为PyTorch 推断方法提供了一种替代方法。
plots bool False 当设置为 True此外,它还能生成并保存预测结果与地面实况的对比图,以便对模型的性能进行可视化评估。
rect bool False 如果 True该软件使用矩形推理进行批处理,减少了填充,可能会提高速度和效率。
split str val 确定用于验证的数据集分割 (valtest或 train).可灵活选择数据段进行性能评估。

3.预测参数

Key 类型 默认值 Description
source str 'ultralytics/assets' 指定推理的数据源。可以是图像路径、视频文件、目录、URL 或用于实时馈送的设备 ID。支持多种格式和来源,可灵活应用于不同类型的输入。
conf float 0.25 设置检测的最小置信度阈值。如果检测到的对象置信度低于此阈值,则将不予考虑。调整该值有助于减少误报。
iou float 0.7 非最大抑制 (NMS) 的交叉重叠 (IoU) 阈值。较低的数值可以消除重叠的方框,从而减少检测次数,这对减少重复检测非常有用。
imgsz int or tuple 640 定义用于推理的图像大小。可以是一个整数 640 或一个(高、宽)元组。适当调整大小可以提高检测精度和处理速度。
half bool False 启用半精度(FP16)推理,可加快支持的 GPU 上的模型推理速度,同时将对精度的影响降至最低。
device str None 指定用于推理的设备(例如:......)、 cpucuda:0 或 0).允许用户选择 CPU、特定 GPU 或其他计算设备来执行模型。
max_det int 300 每幅图像允许的最大检测次数。限制模型在单次推理中可检测到的物体总数,防止在密集场景中产生过多输出。
vid_stride int 1 视频输入的帧间距。允许跳过视频中的帧,以加快处理速度,但会牺牲时间分辨率。值为 1 时处理每一帧,值越大跳帧越多。
stream_buffer bool False 确定在处理视频流时是否对所有帧进行缓冲 (True),或者模型是否应该返回最近的帧 (False).适用于实时应用。
visualize bool False 在推理过程中激活模型特征的可视化,从而深入了解模型 "看到 "了什么。这对调试和模型解释非常有用。
augment bool False 可对预测进行测试时间增强(TTA),从而在牺牲推理速度的情况下提高检测的鲁棒性。
agnostic_nms bool False 启用与类别无关的非最大抑制 (NMS),可合并不同类别的重叠方框。这在多类检测场景中非常有用,因为在这种场景中,类的重叠很常见。
classes list[int] None 根据一组类别 ID 过滤预测结果。只有属于指定类别的检测结果才会返回。在多类检测任务中,该功能有助于集中检测相关对象。
retina_masks bool False 如果模型中存在高分辨率的分割掩膜,则使用高分辨率的分割掩膜。这可以提高分割任务的掩膜质量,提供更精细的细节。
embed list[int] None 指定从中提取特征向量或嵌入的层。这对聚类或相似性搜索等下游任务非常有用。

 预测可视化参数:

Key 类型 默认值 Description
show bool False 如果 True在一个窗口中显示注释的图像或视频。有助于在开发或测试过程中提供即时视觉反馈。
save bool False 可将注释的图像或视频保存到文件中。这有助于记录、进一步分析或共享结果。
save_frames bool False 处理视频时,将单个帧保存为图像。这对提取特定帧或逐帧进行详细分析非常有用。
save_txt bool False 将检测结果保存在文本文件中,格式如下 [class] [x_center] [y_center] [width] [height] [confidence].有助于与其他分析工具集成。
save_conf bool False 在保存的文本文件中包含置信度分数。增强了后期处理和分析的细节。
save_crop bool False 保存经过裁剪的检测图像。可用于数据集扩充、分析或为特定物体创建重点数据集。
show_labels bool True 在可视输出中显示每次检测的标签。让用户立即了解检测到的物体。
show_conf bool True 在标签旁显示每次检测的置信度得分。让人了解模型对每次检测的确定性。
show_boxes bool True 在检测到的物体周围绘制边界框。对于图像或视频帧中物体的视觉识别和定位至关重要。
line_width None or int None 指定边界框的线宽。如果 None根据图像大小自动调整线宽。提供可视化定制,使图像更加清晰。

相关推荐

  1. YOLOv8参数详解

    2024-03-30 10:04:02       64 阅读
  2. YOLO v8 参数设置,详解cfg/default.yaml

    2024-03-30 10:04:02       44 阅读
  3. yolov8 PTQ和QAT量化实战(源码详解)

    2024-03-30 10:04:02       83 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-30 10:04:02       91 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-30 10:04:02       97 阅读
  3. 在Django里面运行非项目文件

    2024-03-30 10:04:02       78 阅读
  4. Python语言-面向对象

    2024-03-30 10:04:02       88 阅读

热门阅读

  1. sql中如何添加数据

    2024-03-30 10:04:02       42 阅读
  2. go中匿名函数的使用

    2024-03-30 10:04:02       41 阅读
  3. 如何解决EventSource 删除单词的前置空格问题

    2024-03-30 10:04:02       35 阅读
  4. 缺失的第一个正数 - LeetCode 热题 17

    2024-03-30 10:04:02       39 阅读
  5. hanlp的使用

    2024-03-30 10:04:02       33 阅读
  6. MongoDB集成springboot

    2024-03-30 10:04:02       38 阅读
  7. 怎么学习写代码?

    2024-03-30 10:04:02       46 阅读