摘要

针对目标检测网络主分支层的特征信息易丢失、不同尺度的特征表达能力不平衡等问题,提出一种基于区域感知的多尺度目标检测算法。在YOLOv5的基础上采用数据增强、改进的边框损失和非极大值抑制方法,构建1个更强健的基线模型,沿着通道方向使用全局最大池化、全局平均池化、卷积等操作设计通道信息增强模块,并分别作用于骨干网络的每个主分支层,使得各个检测头在特征融合过程中也不会丢失主分支层的关键特征,以强化模型对重点区域的感知能力。利用加权特征融合方法融合不同尺度的特征信息,平衡不同尺度的输入特征对输出特征的表达能力,进而提高模型对多尺度目标的感知能力,通过调整模型的通道和深度,设计4种不同规模的网络结构。实验结果表明,相比YOLOv5s,该算法在Pascal VOC、MS COCO、Global Wheat、Wider Face、Motor Defect 5个数据集上的平均精度均值分别提高5.48、3.00、1.94、0.70和1.95个百分点。同时,该算法的平均精度均值最高为50.7%,分别比YOLOv4和Dynamic Head的最大模型提高7.2和3.0个百分点。

全文