摘要
在密集行人检测场景中,目标间的相互遮挡重叠会造成YOLOv3模型的检测性能下降。针对造成YOLOv3性能下降的原因提出三点改进。一是提出了一种聚拢损失函数,通过优化预测框坐标的方差与均值,使得属于同一个目标的预测框更加紧致,进而降低假阳率。二是提出了一种高分辨率特征金字塔,通过上采样提高每层金字塔特征的分辨率,并引入浅层特征以增强相邻子特征的差异,从而为高重叠目标生成具有区分度的深度特征。三是提出了一种基于空间注意力机制的检测头,用以降低冗余预测框的数量,减少非极大值抑制(NMS)过程的计算负担。在密集行人数据集CrowdHuman上进行的实验的结果显示,所提算法在使用传统NMS方法的情况下使得YOLOv3检测的平均精度和召回率分别提高了2.91个百分点和3.20个百分点,丢失率降低了1.24个百分点,有效提升了对遮挡行人的检测性能。
- 单位