摘要
针对视频图像中因小目标行人、遮挡和行人姿态多变而造成行人再识别率低的问题,建立了一种基于EfficientNet高效网络的双分路多尺度联合学习方法。首先采用性能高效的EfficientNet-B1网络作为主干结构,然后利用加权双向特征金字塔(BiFPN)分支对提取的不同尺度全局特征进行特征融合,得到包含不同层次语义信息的全局特征,以提高小目标行人的识别率;其次利用PCB分支提取深层局部特征来挖掘行人的非显著信息,改善行人遮挡和姿态多变对识别率的影响。最后在训练阶段将两个网络分支分别提取的行人特征通过Softmax函数得到不同子Loss,并相加进行联合表示;在测试阶段将获得的全局特征和深层局部特征拼接融合,计算欧式距离得到再识别匹配结果。该方法在Market1501和DukeMTMC-Reid数据集上Rank-1的准确率分别达到了95.1%和89.1%,与原始EfficientNet-B1主干结构相比分别提高了3.9和2.3个百分点。实验结果表明,所提出模型有效提高了行人再识别的准确率。
- 单位