摘要
为解决图像检索中视觉特征与语义概念间的语义鸿沟现象,导致其检索不准确的问题,设计非负矩阵分解耦合视觉多样性的图像检索算法。对图像进行非负矩阵分解(non-negative matrix factorization,NMF),得到图像的基矩阵与系数矩阵;在NMF过程中嵌入整体视觉多样性,利用图像之间的差异描述视觉多样性;引入两个正则项对其进一步优化,根据分解因子的乘积完成缺失标签的重构,获取标签图像矩阵;利用图像矩阵的标签语义距离进行相似性度量,完成图像检索。实验结果表明:在Flickr25K、VOC2012数据集中,与当前检索技术比较,所提算法具有更高的检索精度。
- 单位