摘要
随着跨模态数据间相似性度量越来越精细化,传统的词袋模型、隐狄利克雷分配模型已无法满足对于文本数据特征提取的需求,为此提出了基于平滑逆频率(Smooth Inverse Frequency,SIF)文本特征的跨模态相似性度量方法。为获得更加精准的文本特征,用SIF方法完成对文本数据的特征提取;语义匹配的方法完成跨模态数据的相似性度量。实验结果显示,对比传统的文本特征提取方法,利用SIF方法获得的文本特征能获得到更好的跨模态相似性度量结果,突出了模态内数据的特征提取作为跨模态相似性度量前提的重要性。
-
单位国防科技大学; 中国人民解放军陆军工程大学