目标检测-One Stage-YOLO v3

2024-01-05 10:10:07
开发
44

文章目录

前言
一、YOLO v3的网络结构和流程
二、YOLO v3的创新点
总结

前言

根据前文目标检测-One Stage-YOLOv2可以看出YOLOv2的速度和精度都有相当程度的提升，但是精度仍较低，YOLO v3基于一些先进的结构和思想对YOLO v2做了一些改进。

提示：以下是本篇文章正文内容，下面内容和可供参考

一、YOLO v3的网络结构和流程

将影像输入卷积网络（DarkNet53）+PAN结构得到多尺度特征图

ps：

Darknet53，由Darknet19结合Resnet而成

PAN结构，即多尺度特征结合FPN特征

利用anchor机制获取预选框
将上一步得到的anchor输入不同的分类和边框回归器
使用非极大值抑制NMS去除冗余窗口

在这里插入图片描述

二、YOLO v3的创新点

具体来说，没有什么大的创新点，但是结合先进的思想改进了YOLOv2：

将backbone的网络结构进行了改进，将Darknet19结合Resnet（残差块轻量化），变成了Darknet53（Darknet53的性能与ResNet152相似，速度快2倍）
引入多尺度特征图（feature maps），每个尺寸的feature map各司其职，13 × 13负责大目标物体，26 × 26负责中目标物体和52 × 52负责小目标物体。原因很简单，越深层的信息越抽象，越浅层的越粗糙，浅层还保留着小物体的信息，深层就不一定还在了。

ps：和SSD一样，感受野小的feature map检测小目标（较小的scale），使用感受野大的feature map检测更大目标（较大的scale），但加入了特征融合机制。

类别预测方面使用多个逻辑回归分类器（logistic）代替softmax分类器，以此来确定预测框属于多类的可能

softmax（全部类别的概率之和为1）假定全部类别是互斥的，即如果预测框属于类别A，那么就不可能属于类别B

但面对非互斥类别集时，softmax不能判别多类别归属，比如预测框可能既属于“动物”，又属于“狗”，尤其对于Open Images这种数据集，目标可能有重叠的类别标签

因此yolov3使用不同的logistic回归分类器（数量和类别数对应）检验bbox为每个类别的置信度（objectness score），如果超过一定阈值，就可认为bbox属于某个类别，即可实现多类别分类

总结

YOLOv3-320(28.2mAP)与SSD321一样准确（28.0mAP[.5, .95]），但速度快三倍（61ms -> 22ms）

在mAP50上（57.9），YOLOv3-608和当时的SOTA（RetinaNet-101-800）精度一样（57.5），但要快3.8倍（198ms -> 51ms）

在这里插入图片描述

原文地址:https://blog.csdn.net/long11350/article/details/135357677 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1743092479676256256.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

yoloV3的目标检测_3.11

2024-01-05 10:10:07 15 阅读
经典目标检测YOLO系列(三)YOLOv3算法详解

2024-01-05 10:10:07 27 阅读
Python Opencv实践 - Yolov3目标检测

2024-01-05 10:10:07 59 阅读
目标检测——YOLOv3算法解读

2024-01-05 10:10:07 17 阅读
目标检测算法YOLOv3简介

2024-01-05 10:10:07 13 阅读
目标检测-One Stage-YOLO v3

2024-01-05 10:10:07 45 阅读
yolov5目标检测

2024-01-05 10:10:07 34 阅读
深度学习目标检测（2）yolov3设计思想

2024-01-05 10:10:07 29 阅读
C# OpenCvSharp DNN 部署yolov3目标检测

2024-01-05 10:10:07 30 阅读
YOLOV3 SPP 目标检测项目(针对xml或者yolo标注的自定义数据集)

2024-01-05 10:10:07 44 阅读