摘要

行人重识别领域的众多工作都表明,采用多分支神经网络搭配注意力模块是一种实现高性能特征嵌入的有效方式。传统方案主要关注于多分支网络结构的设计,而在注意力机制的设计上存在明显不足,如当前注意力机制缺乏对特征位置信息的有效挖掘和利用。为此,该文在多尺度特征金字塔分支(Feature Pyramid Branch, FPB)网络的框架下,分析了不同注意力模块的引入对系统性能的影响;在此基础上,讨论了两种在注意力机制中融入位置信息的方法,提出了一种新的位置感知注意力模块,该模块具有即插即用的优点,便于融入各种主干网络。在多个流行行人重识别标准数据集上的实验表明,融入位置感知注意力模块的FPB网络相比于原FPB网络,仅需增加0.29 M参数就可以显著提升最终的模型识别准确率:rank-1在Market1501上提高0.7百分点,在DukeMTMC上提高1.5百分点,在CUHK03-Labeled上提高2.4百分点,在CUHK03-Detected上提高3.8百分点。