摘要

针对密集场景下行人检测的遮挡问题,文中提出了基于YOLO(You Only Look Once)的SC-YOLOv4人群检测网络。在YOLOv4的CSPNet(Cross Stage Partial Network)结构基础上,结合ShuffleNetv2网络思想改进普通卷积结构,将原来普通的残差模块替换为Shuffle Module模块,提出了基于S-CSPDarkNet53(Shuffle CSPDarkNet53)的骨干网络结构,在保留精度的同时降低了网络参数量。文中在保留原来PANet(Path Aggregation Network)结构的基础上设计中心点预测模块,将原来的3个输出特征层改用基于中心点的预测方法,即对目标的中心点进行回归和训练计算损失,摒弃了原来的NMS(Non-Maximum Suppression)操作,进一步提高遮挡情况下的检测精度。实验结果表明,在CrowdHuamn数据集上采用S-CSPDarkNet53结构的YOLOv4较原网络的参数量显著减少,检测速度提升了5.2 frame·s-1,而最终的SC-YOLOv4网络在检测速度上较YOLOv4提升了4.9 frame·s-1。

全文