摘要
针对行人重识别中行人文本属性信息未被充分利用以及文本属性之间语义联系未被挖掘的问题,提出一种基于多模态的图卷积神经网络行人重识别方法。首先使用深度卷积神经网络学习行人文本属性与行人图像特征,然后借助图卷积神经网络有效的关系挖掘能力,将文本属性特征与图像特征作为图卷积神经网络输入,通过图卷积运算传递文本属性节点语义信息,从而学习文本属性间隐含的语义联系信息,并将该语义信息融入到图像特征中,最后图卷积神经网络输出鲁棒的行人特征。该多模态的行人重识别方法在Market-1501数据集上获得了87.6%的平均精度均值(m AP)和95.1%的Rank-1精确度;在DukeMTMC-reID数据集上获得了77.3%的平均精度均值(m AP)和88.4%的Rank-1精确度,实验结果表明了本文方法的有效性。
- 单位