摘要

行人搜索任务是智能视频监控中的重要研究方向,然而传统基于深度神经网络的行人搜索算法计算量大,大规模部署时搜索性能低下,导致算法在落地应用时面临着高成本、速度慢的难题。针对此问题,提出一种基于Sophon SC5+高性能推理芯片的行人检测与重识别算法,从算法到硬件自上而下的方法来优化深度学习的效率。首先行人检测模块以YOLOv5s的网络模型为基础,利用Ghost模块轻量化的特点,替换主干网络模块,大幅度降低行人检测模型的参数和计算量;再融入CBAM注意力机制,增强算法的特征学习能力,提高检测精度。其次行人重识别模块增加了中心损失约束和 Non-local注意力机制,并将中心约束三元组损失和附加间隔交叉熵损失共同组合来对模型监督优化,提升行人重识别算法性能。最后,基于Sophon SC+量化行人检测模型和行人重识别模型生成最终的推理模型。在COCO数据集上的,所提出的行人检测算法与YOLOv5s相比,模型大小减少了25%,mAP相差在0.8个百分点;在Market1501、DukeMTMC-ReID数据集上,所提出的行人重识别算法的mAP相较于基准模型分别提高了1.5个百分点、1.2个百分点,Rank-1分别提高了0.6个百分点、1.5个百分点。两个模型基于Sophon SC5+芯片实现int8量化后,行人检测模型的mAP下降了2.0个百分点,模型大小减少了72.1%;行人重识别模型的mAP下降了1.7个百分点,模型大小减少了75.8%。实验结果表明,所提算法结合Sophon SC5+芯片,在算法精度损失小的基础上,极大地提高了算法性能,能够在大规模、城市级行人搜索系统中落地使用。