摘要

基于文本的自动问答系统一般包含问句处理、问句匹配和答案选取三个模块,衡量系统的重要指标(包括答案选取的效率和准确性)与问句匹配模块的相关度最高,因此从一个自动问答系统落地应用的角度出发,本文在问句匹配模块中提出了一种有监督和无监督相结合的短文本相似度计算方案。实验部分设计了基于Siamese Network框架的短文本相似度计算与基于word2vec词向量的无监督计算方法对比,验证了有监督计算方法在准确率方面的优势。