摘要
词向量(Word2Vec)是近些年来自然语言处理领域的重要算法,在近几年的人工智能发展中占有极其重要的地位。通过向量空间的形式对每一个词进行标志,进而在概率方面上对词进行表示。Word Mover Distance算法是Earth Mover Distance的一个特殊形式,用来计算一组向量之间最短距离。文章使用上述两个算法作为基底,对词向量进行相关的空间映射预处理操作,作为WMD(word mover distance)的输入参数,最终可以得到句子间相似度得分。实验表明,该方法使相似语句与不相关语句之间的距离差距更大,且在专家系统中相似问句之间的距离更加紧密,更能显著刻画句子之间的语义相似程度,有利于增加短文本匹配的准确度。
-
单位重庆大学; 信息工程大学