目标检测人工智能计算机视觉论文改进特征融合篇 | YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-Time Object Detection

我们的目标是为目标检测社区提供一种高效且性能卓越的目标检测器，命名为YOLO-MS。该核心设计基于对不同卷积核尺寸对不同尺度对象检测性能的影响进行的一系列研究。研究结果是一种新策略，能够显著增强实时目标检测器的多尺度特征表示。为验证我们策略的有效性，我们构建了一个名为YOLO-MS的网络架构。我们从头开始在MS COCO数据集上训练YOLO-MS，而不依赖于任何其他大规模数据集，如ImageNet，或预训练权重。在没有花哨的设计的情况下，我们的YOLO-MS在使用可比较数量的参数和FLOPs时，优于最近的实时目标检测器的最新技术水平，包括YOLO-v7和RTMDet。以YOLO-MS的XS版本为例，仅具有4.5百万可学习参数和8.7G FLOPs，它在MS COCO上可以达到43%+的AP分数，比具有相同模型大小的RTMDet高出约2%+。此外，我们的工作还可以作为其他YOLO模型的即插即用模块。通常情况下，我们的方法显著提高了YOLOv8的AP分数，从37%+提升到40%+，甚至使用更少的参数和FLOPs。

论文地址：https://arxiv.org/pdf/2308.05480.pdf 代码地址：https://github.com/FishAndWasabi/YOLO-MS

参考文章

评论可见，请评论后查看内容，谢谢！！！

您阅读本篇文章共花了：

金钥匙

目标检测人工智能计算机视觉论文改进特征融合篇 | YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-Time Object Detection

深度学习人工智能《从零深入理解Yolo系列v1-v8全家桶 + 目标检测面试提问+目标检测算法总览》

深度学习人工智能目标检测 DINO在Windows环境下训练自定义数据集

发表评论取消回复

金钥匙

目标检测 人工智能 计算机视觉 论文 改进 特征融合篇 | YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-Time Object Detection

深度学习 人工智能 《从零深入理解Yolo系列v1-v8全家桶 + 目标检测面试提问+目标检测算法总览》

深度学习 人工智能 目标检测 DINO在Windows环境下训练 自定义数据集

相关文章

发表评论取消回复

目标检测人工智能计算机视觉论文改进特征融合篇 | YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-Time Object Detection

深度学习人工智能《从零深入理解Yolo系列v1-v8全家桶 + 目标检测面试提问+目标检测算法总览》

深度学习人工智能目标检测 DINO在Windows环境下训练自定义数据集