人工智能计算机视觉小目标检测【目标检测】VisDrone数据集介绍

测试软件开发人工智能 2024-03-21 16 0

文章目录

一、VisDrone2019数据集介绍1.1 用于目标检测的时候1.2 数据评估

一、VisDrone2019数据集介绍

配备摄像头的无人机（或通用无人机）已迅速投入广泛应用领域，涵盖了农业、航空摄影、快速交付和监视等多个领域。因此，对于从这些平台收集的视觉数据的自动理解需求日益增加，使得计算机视觉与无人机技术之间的联系变得越来越密切。我们很高兴为各类重要的计算机视觉任务提供一个庞大的基准，精心标注了地面真实情况，将其命名为VisDrone，将视觉与无人机技术融合在一起。

VisDrone2019数据集由天津大学机器学习和数据挖掘实验室AISKYEYE团队收集。

该基准数据集包含288个视频片段，由261,908帧视频和10,209幅静态图像组成，这些数据来自各类无人机摄像头，覆盖范围广泛，包括不同城市（来自中国14个不同城市，相隔数千公里）、不同环境（城市和农村）、不同物体（行人、车辆、自行车等）和不同密度（稀疏和拥挤场景）。需要注意的是，数据集是在不同场景、不同天气和光照条件下使用不同型号的无人机平台收集的。超过260万个感兴趣的目标框（如行人、汽车、自行车和三轮车）已经手工标注，同时提供了一些重要属性，包括场景可见性、对象类别和遮挡情况，以更充分地利用数据。此次挑战主要集中在以下四个任务上：

任务1：图像中的目标检测挑战。该任务旨在从无人机拍摄的单个图像中检测预定义类别的物体（如汽车和行人）。任务2：视频中的物体检测挑战。与任务1相似，不同之处在于需要从视频中检测物体。任务3：单物体跟踪挑战。任务4：多目标跟踪挑战。任务5：人群计数挑战。该任务旨在统计每个视频帧中的人数。

这一系列任务的设置旨在全面评估无人机视觉系统在不同情境下的性能，为相关领域的研究和发展提供了重要的参考和基准。

1.1 用于目标检测的时候

VisDrone是一个无人机的目标检测数据集，在很多目标检测的论文中都能看到它的身影。标签从0到11分别为：

“ignored regions”、“pedestrian”、“people”、“bicycle”、“car”、“van”、“truck”、“tricycle”、“awning-tricycle”、“bus”、“motor”、“others”。

包含10209张静态图像(6471张用于训练，548张用于验证，3190张用于测试)

注释标签：

其中，前五列为：，，，，

：预测边界框左上角的 x 坐标：预测对象边界框左上角的 y 坐标：预测对象边界框的宽度（以像素为单位）：预测对象边界框的高度（以像素为单位）

DETECTION 文件中的分数表示预测的包围框的置信度一个对象实例。GROUNDTRUTH 文件中的分数设置为 1 或 0。1 表示评估时考虑边界框，而 0 表示将忽略边界框。

：对象类别指示注释对象的类型（即忽略区域（0）、行人（1）、人(2)、自行车(3)、汽车(4)、面包车(5)、卡车(6)、三轮车(7)、遮阳三轮车(8)、巴士(9)、摩托车(10)、其他(11))

1.2 数据评估

与MS COCO的评估协议类似，我们使用 AP, APIOU=0.50, APIOU=0.75, ARmax=1, ARmax=10, ARmax=100, and ARmax=500 metrics to evaluate the results of detection algorithms。除非另有规定，AP和AR指标是在联合(loU)值的多个交集上平均的。

AP 100%：The average precision over all 10 IoU thresholds (i.e., [0.5:0.05:0.95]) of all object categories（所有对象类别的10个IoU阈值(即[0.5:0.05:0.95])的平均精度）

APIOU=0.50 100%： The average precision over all object categories when the IoU overlap with ground truth is larger than 0.50（当IoU与地面真实值重叠时，所有对象类别的大于0.50的平均精度）

APIOU=0.75 100%： The average precision over all object categories when the IoU overlap with ground truth is larger than 0.75

ARmax=1 100%： The maximum recall given 1 detection per image，给定每幅图像一次检测的最大召回率

ARmax=10 100%： The maximum recall given 10 detections per image，给定每幅图像10次检测的最大召回率

ARmax=100 100%： The maximum recall given 100 detections per image

ARmax=500 100%： The maximum recall given 500 detections per image

金钥匙

人工智能计算机视觉小目标检测【目标检测】VisDrone数据集介绍

【超详细】【YOLOV8使用说明】一套框架解决CV的5大任务：目标检测、分割、姿势估计、跟踪和分类任务【含源码】

python 深度学习目标检测 yolov7: 从搭配环境到训练自己的数据集

发表评论取消回复

金钥匙

人工智能 计算机视觉 小目标检测 【目标检测】VisDrone数据集介绍

【超详细】【YOLOV8使用说明】一套框架解决CV的5大任务：目标检测、分割、姿势估计、跟踪和分类任务【含源码】

python 深度学习 目标检测 yolov7: 从搭配环境到训练自己的数据集

相关文章

发表评论取消回复

人工智能计算机视觉小目标检测【目标检测】VisDrone数据集介绍

python 深度学习目标检测 yolov7: 从搭配环境到训练自己的数据集