摘要
为了提高文本语义相似性度量的准确性,该文从深度学习的角度出发提出了一种新的文本语义相似性度量框架,充分利用深度神经网络实现词级别、句子级别、文本级别的表示学习,使得学习到的表示向量能提供融合上下文信息的丰富语义信息,在此基础上,设计了相似性度量层,采用简单的三层网络实现任意两个文本向量的相似性值计算。在两个基准数据集上进行了试验验证,试验结果表明提出的文本语义相似性度量能准确地度量文本相似性,在MPRC和SNLI数据集上分别获得了89.33%和94.53%的F1-score值,优于选取的对比方法。
-
单位东南大学成贤学院