摘要

近些年可见光-红外行人重识别受到众多学者的关注,其目标是从不同模态的图像中匹配出相同身份的行人图像,但由于可见光图像和红外图像之间的巨大差异,导致可见光-红外行人重识别是一项非常具有挑战性的图像检索问题。现有的研究主要集中在通过设计网络结构提取共享特征或生成中间模态来缓解模态差异,容易受到行人之外的区域影响。为了解决此类问题,重点关注行人信息,进一步减小两种模态之间的差异,提出一种双注意力机制的网络结构用于可见光-红外行人重识别,一方面通过双注意力机制挖掘不同尺度的行人空间信息和增强局部特征的通道交互能力,另一方面利用全局分支和局部分支,学习多粒度的特征信息,使不同粒度信息可以相互补充,形成一个更具辨别性的特征。在两个公共数据集上的实验结果表明,该方法相较于基线有明显的提升,在RegDB数据集和SYSU-MM01数据集上均表现出理想的性能。

全文