摘要

https://www.mdpi.com/2504-446X/7/8/526 在各种研究领域中,对无人机的图像进行目标检测是一项有意义的任务。然而,无人机的图像带来了独特的挑战,包括图像尺寸大、检测对象尺寸小、对象密集分布、对象重叠以及光线不足影响目标检测的准确性。本文提出了Drone-YOLO,这是一系列基于YOLOv8模型的多尺度UAV图像目标检测算法,旨在克服与UAV图像目标检测相关的特定挑战。为了解决大场景尺寸和小型检测对象的问题,我们对YOLOv8模型的颈部组件进行了改进。具体来说,我们采用了三层PAFPN结构,并加入了一个针对小尺寸物体量身定制的检测头,使用了大规模的特征图,从而显著提高了算法对小型目标的检测能力。此外,我们将sandwich fusion模块整合到颈部上下分支的每一层中。这种融合机制将网络特征与低级特征相结合,为不同层检测头提供了丰富的空间信息。我们使用depthwise separable evolution实现这种融合,它在参数成本和大的接收域之间达到了平衡。在网络的骨干中,我们采用RepVGG模块作为下采样层,提高了网络学习多尺度特征的能力并超越了传统的卷积层。提出的Drone-YOLO方法已在消融实验中进行评估,并与VisDrone2019数据集上的其他最先进方法进行了比较。结果表明,我们的Drone-YOLO (large) 在目标检测准确性方面优于其他基线方法。与YOLOv8相比,我们的方法在mAP0.5指标上取得了显著改进,在VisDrone2019-test上增加了13.4%,在VisDrone2019-val上增加了17.40%。此外,参数高效的Drone-YOLO (tiny) 仅使用5.25M个参数,在数据集上的表现与使用9.66M个参数的基线方法相当或更好。这些实验验证了Drone-YOLO方法在无人机图像目标检测任务中的有效性。

相关阅读

评论可见,请评论后查看内容,谢谢!!!
 您阅读本篇文章共花了: