摘要
针对复杂场景下初始锚框难以匹配目标及多尺度检测能力不强的问题,提出一种基于YOLOv5的增强多尺度目标检测(EM-YOLOv5)方法。通过Kmeans++聚类算法,获得适应当前检测场景下的多尺度初始化锚框,使得网络更容易捕捉到不同尺度目标;在Bottleneck结构中增加多条不同尺度的并行卷积支路,在保留原有特征信息的同时融合多尺度的特征信息,增强模型的全局感知能力。在VisDrone2019、COCO2017和PASCAL VOC2012数据集上对提出的EM-YOLOv5s模型进行测试。实验结果表明,与YOLOv5s模型相比,mAP@0.5∶0.95、mAP@0.5等关键指标均有一定提升,在PASCAL VOC2012上,mAP@0.5∶0.95提升5.2%,而检测时间仅增加1.9 ms,说明EM-YOLOv5模型能够有效地提升通用复杂场景下的目标检测精度。
- 单位