文本相似度计算研究进展综述

作者:王寒茹; 张仰森*
来源:北京信息科技大学学报(自然科学版), 2019, 34(01): 68-74.
DOI:10.16508/j.cnki.11-5866/n.2019.01.013

摘要

相似度计算是自然语言处理工作的基石。随着自然语言处理技术的发展,相似度计算的研究价值和应用价值突显。现有的计算方法因其复杂度和精确度的问题,与现实应用的需求并不匹配。针对现有需求,对于不同粒度的文本,研究出一套适合大规模实际应用的相似度计算方法体系迫在眉睫。从方法论的角度,对目前主流的相似度计算方法进行总结,介绍了不同粒度的文本相似度计算的差别以及近几年的研究进展,总结了目前相似度计算方向存在的问题,并对发展趋势进行了展望。

全文