摘要

[目的 /意义]互联网中存在的信息多数是以文本、图像、视频等相结合的形式,即所谓的跨媒体数据。传统的检索方式包括以文检文、以图检图,它们已不能满足如今信息检索的需求,所以跨媒体数据检索应运而生,跨媒体数据检索的研究具有非常重要的研究意义及应用价值。[方法 /过程]本文利用Doc2vec模型和VGG16模型分别处理文本和图片数据得到各自的特征值,根据特征值的相对语义距离对文本和图片数据进行匹配,从而实现自动的给文字配图片或者为图片选择标签。[结果/结论]本文提出的方法能够通过提取不同形式的数据特征对数据进行融合,有效提升了图片和文本数据自动匹配的命中率,实现了基于异构数据特征的图文检索。