摘要

针对视频行人重识别任务中存在的行人外观、遮挡等问题,研究并设计了一个基于金字塔分割和注意力机制的视频行人重识别模型。首先,为了增强图模型对行人局部特征的识别能力,提出了多个尺度的水平金字塔分割方法,将各特征分别分割成不同大小的区域,并池化成统一尺寸后输入图模型。另外,鉴于简单的时空注意模块容易因遮挡破坏行人特征,因此使用时空相关注意力方法改进时空注意模块,逐步学习并聚合空间局部信息,同时在时序上相互作用,抑制行人干扰特征并增强判别特征。将模型在Mars和DukeMTMC-VideoReID两个数据集上进行了评估,实验结果证实了文中提出方法的有效性。