摘要
问答系统是自然语言处理领域中的一项重要任务,常应用于医疗服务。传统的问答系统通过知识图谱的实体关系匹配返回相应的尾实体作为答案,然而,倘若实体或关系无法识别或在知识图谱中并不存在相应实体关系,问答将无法继续进行。为了解决这一问题,文中建立了一种融合知识图谱和语义匹配模型的中文医疗问答混合框架,当所提问题无法在知识图谱中进行实体关系匹配时,该模型能继续从问答对数据集中找到最相似的问题,并返回相应结果作为答案。在语义匹配模型方面,结合中文医疗相似问题对,在Sentence-BERT模型上进行微调训练,并引入了双曲空间中的距离度量函数对句子对进行相似度度量。在整体性能方面,该模型相较于BERT这类大语言模型能有7.16%的精度提升;在度量能力方面,双曲度量相较于通用欧氏空间度量,如余弦度量,最高能有2.28%的精度提升和1.58%的F1值提升。