中文复述问句生成技术研究

作者:曹雨; 张宇; 刘挺
来源:智能计算机与应用, 2019, 9(01): 192-198.
DOI:10.3969/j.issn.2095-2163.2019.01.044

摘要

自动问答系统允许用户以自然语言进行提问,问题的形式多样、结构复杂,对系统的理解能力提出了极高要求。问句复述生成技术可将提出的复杂问句改写成一系列与之语义相同但形式不同的问句,避免了用户提问的不规范,可大大降低系统对问句的理解和处理难度,对于提升自动问答系统的效果有着重要意义。本文提出了一种基于模板匹配的复述问句生成方法,该方法可有效保留问句的结构特征和语义特征。引入功能标签,突出问句的结构特征;引入依存关系,提高了问句模板的泛化性能;引入候选排序,大幅提升了生成结果的准确率。通过与已有的生成方法进行对比试验,证实了该方法的有效性。

全文