摘要
文本行人跨模态检索是指通过对行人的语言描述在行人图像集中检索出对应身份的图像。针对文本特征判别性不足的问题,提出在文本支路结合BERT模型和Text-CNN网络来提升文本特征判别性的方法。该方法主要采用BERT模型作为词嵌入工具,并使用Text-CNN网络对文本特征进行进一步的特征提取。此外,除了使用全局匹配以外,该方法还考虑了局部特征对检索的影响。在CUHK-PEDES数据集上对所提方法进行了实验验证,实验结果证明了所提方法的有效性和优越性。
-
单位昆明理工大学; 自动化学院