摘要
【目的】通过语义自编码器挖掘底层特征和高层语义之间的相关性,缩小不同模态数据之间的异构鸿沟,并结合哈希学习提高跨模态检索的精度和速率。【方法】利用语义标签信息学习特征语义联合表示,构造语义仿射矩阵,结合自编码器和线性回归学习哈希函数,通过相似性度量获得最优的哈希码。【结果】在WIKI、MIRFLICKR、NUS-WIDE三个公开数据集上进行验证,所提方法在4种不同码长下的平均MAP值较LSSH、FSH、ACQ、DBRC、SPDH、SePH、SMH中的最高值分别提高0.113 5、0.027 8、0.050 5。【局限】所提方法主要适用于对多种模态数据进行线性投影,对于非线性问题未能取得较好的效果。【结论】所提方法可以缩小多模态数据之间的异构鸿沟,将不同模态相似数据转化为相同的哈希码,有效提高了跨模态检索的精度和速率。
- 单位