我们的目标是为目标检测社区提供一种高效且性能卓越的目标检测器,命名为YOLO-MS。该核心设计基于对不同卷积核尺寸对不同尺度对象检测性能的影响进行的一系列研究。研究结果是一种新策略,能够显著增强实时目标检测器的多尺度特征表示。 为验证我们策略的有效性,我们构建了一个名为YOLO-MS的网络架构。我们从头开始在MS COCO数据集上训练YOLO-MS,而不依赖于任何其他大规模数据集,如ImageNet,或预训练权重。在没有花哨的设计的情况下,我们的YOLO-MS在使用可比较数量的参数和FLOPs时,优于最近的实时目标检测器的最新技术水平,包括YOLO-v7和RTMDet。 以YOLO-MS的XS版本为例,仅具有4.5百万可学习参数和8.7G FLOPs,它在MS COCO上可以达到43%+的AP分数,比具有相同模型大小的RTMDet高出约2%+。此外,我们的工作还可以作为其他YOLO模型的即插即用模块。通常情况下,我们的方法显著提高了YOLOv8的AP分数,从37%+提升到40%+,甚至使用更少的参数和FLOPs。

论文地址:https://arxiv.org/pdf/2308.05480.pdf 代码地址:https://github.com/FishAndWasabi/YOLO-MS

参考文章

评论可见,请评论后查看内容,谢谢!!!
 您阅读本篇文章共花了: