摘要
针对城市街道场景中小目标和密集目标检测准确率不高的问题,提出一种改进的YOLOv5的目标检测模型——City-YOLO。首先利用可变形卷积和Focus模块设计了两种新的下采样模块,使骨干网络(Backbone)与Neck层提取特征信息更准确,同时融合了全局特征信息;其次增加一层检测特征层,增强小目标的检测能力;随后将二阶通道注意力机制引入检测特征层,使网络更加关注目标的重要特征,提升网络对密集遮挡目标的检测能力;最后使用Kmeans算法重新设计了先验框,并将它分配到相应的检测特征层。在CityScape数据集上,City-YOLO模型的均值平均精度mAP50与mAP50:95分别达到了54.3%和30.6%;相较于YOLOv5,mAP50与mAP50:95分别提升了5.8和4.0个百分点。实验结果表明,City-YOLO模型有效地实现了高精度城市街道场景目标检测。
- 单位