摘要

行人检测是利用计算机视觉技术判断图像或者视频序列中是否存在行人并给予精确定位。本文针对行人检测在密集场景下普遍存在的行人间遮挡问题,提出基于迭代Faster R-CNN的密集行人检测模型,利用一种IterDet迭代方案对Faster R-CNN进行改进,有效解决非极大值抑制(NMS)算法及其改进在选择精确度和召回率之间平衡点的难题。同时利用递归金字塔结构(RFP)进一步增强模型提取特征能力。本文在具有挑战性的WiderPerson和CrowdHuman数据集上进行训练和验证,实验结果表明,本文模型相比Faster R-CNN在精度和召回率显著提升的同时,漏检率也明显降低。尤其在WiderPerson数据集上召回率、精度、漏检率等性能指标分别达到了97.65,91.29,40.43的SOTA结果。