摘要

为进一步提升跨模态检索性能,提出了自注意力相似度迁移跨模态哈希网络。设计了一种通道空间混合自注意力机制强化关注图像的关键信息,并使用共同注意力方法加强模态信息交互,提高特征学习质量;为在哈希空间重构相似关系,采用迁移学习的方法利用实值空间相似度引导哈希码的生成。在三个常用的数据集MIRFLICKR-25K、IAPR TC-12和MSCOCO上与DCMH、PRDH、SCAHN等优秀方法进行对比实验,结果显示哈希码长度为64的条件下,三个数据集图像检索文本任务的平均精确度均值达到72.3%,文本检索图像任务的平均精确度均值达到70%,高于对比算法。

全文