摘要

问句相似度计算是基于问答对的问答系统的核心任务。针对单独使用问句向量的方式来计算问句相似度的准确率较低的问题,提出一种将BERT向量、Jaccard相似度与词性权重结合的相似度计算方法。该方法使用BERT模型来构建问句的向量并计算余弦相似度值,再结合Jaccard相似度和词性权重来对句子相似度进行计算,最终将3种相似度值进行加权计算得出最终的相似度。实验结果表明,该方法能有效提高问句相似度匹配的准确率,其准确率可以达到86.6%,相比单独使用BERT模型具有更高的准确率,将其应用于番茄问答系统中具有更好的效果。