一种基于词向量及位置编码的Jaccard相似度算法

作者:周艳平; 李金鹏
来源:青岛科技大学学报(自然科学版), 2020, 41(06): 93-98.
DOI:10.16351/j.1672-6987.2020.06.013

摘要

针对句子的词序问题,提出了一种基于词向量及位置编码的Jaccard相似度算法。该方法首先使用词向量模型将每个词映射成高维语义向量,然后结合词位置编码计算出各个词向量的相似度,最后使用Jaccard算法计算出句子之间最终的相似度。实验结果证明:本工作提出的方法与传统的Jaccard算法和基于词向量的Jaccard相似度算法相比,有效提升了相似度准确率,对词序也有很好的辨别能力。