基于改进句子相似度算法的释义识别研究

作者:陈俊月; 郝文宁*; 张紫萱; 唐新德; 康睿智; 莫斐
来源:计算机工程, 2020, 46(09): 76-82.
DOI:10.19678/j.issn.1000-3428.0055313

摘要

针对现有句子相似度算法无法处理同义词、准确率低和复杂度高等不足,结合词向量技术改进Levenshtein相似度算法和Jaccard系数,提出一种新的句子相似度算法用于释义识别,并对多种句子相似度算法的优劣进行分析,设计多相似度特征组合的应用模式。基于MRPC释义识别数据集的实验结果表明,使用该算法的释义识别模型准确率与F1值分别达到74.4%和83.1%,与使用TF-IDF算法、词袋算法等传统算法的模型相比识别性能更优。

  • 单位
    中国人民解放军陆军工程大学