摘要

在工业视频监控场景中,由于复杂背景、人体多姿态和人体遮挡等因素的影响,现有人体检测算法存在着准确率不高、模型泛化能力不强等显著问题。针对以上问题,基于特征图像金字塔和多尺度感受野理论,设计了一种检测网络的特征融合方式和特征图的生成策略,依靠轻量级的特征图像金字塔技术,并结合数据增强、锚点框匹配策略和遮挡损失函数等优化方法,进而提出了一种基于深度神经网络的人体检测算法EFIPNet。同时,为了充分验证EFIPNet算法的有效性,共建立了4个多元化的复杂监控场景下的人体数据集,其中涉及50种常见的人体行为。算法的有效性验证表明,新设计的高效人体检测算法可以有效地提高人体目标的检测精度,实现复杂监控场景下的人体精确和实时检测。此外,为了验证EFIPNet算法中不同模块的有效性,采用消融研究方法分析了网络中主要模块对人体检测模型性能的影响。在Person数据集上,EFIPNet算法在保持45帧/s检测速度的同时,相比于单发多盒检测器检测算法,将人体目标的检测精度提升了4.34%。

全文