摘要

哈希编码由于其存储小、检索快的优点,在跨模态检索中受到了广泛的关注。现有的跨模态哈希算法低估了不同类别标签之间语义差异的重要性且忽略了哈希向量的平衡条件,使得所学习的哈希码的判别性能差。此外,一些方法利用标签信息构造相似性矩阵,并将多标签数据视为单标签数据进行建模,这在多标签跨模态检索中造成了较大的语义损失。为了保留了异构数据之间精确的相似程度和哈希向量的平衡特性,提出了一种新的有监督哈希算法,称为基于判别性矩阵分解的多标签跨模态哈希检索(DMFH)。该方法利用核化特征的协同矩阵分解来获得一个共享的隐式子空间。为了度量异构数据的相似性,利用数据之间共有标签的比例来描述数据的相似程度。此外,利用标签信息构造平衡矩阵,生成具有平衡特性的哈希向量,以最大化不同类别标签之间的类间距。在两个常用多标签数据集(MIRFlickr数据集和NUS-WIDE数据集)下的实验表明,所提算法对于保持语义信息和相似性关系起到显著作用,在平均精度均值方面,与最优的矩阵分解对比方法JIMFH相比分别提升了6%和8%。