摘要
常识问答是一项重要的自然语言处理任务,旨在让模型结合常识对给定的问题进行解答。然而,现有模型容易受到知识源中噪声知识的干扰,且对多知识源的融合与利用不够充分,所以问答效率低。为此,文章从筛选知识和利用多知识源的角度出发,提出了由多知识源信息获取和多通道融合推理级联而成的常识问答方法。该方法首先从多个外部知识源检索或匹配知识,再根据贪心筛选策略对噪声知识进行过滤,最后利用多个编码通道对知识和问题进行编码,融合各知识源不同类型的信息并推断出答案。算法在数据集Commonsense QA上的结果表明,本文方法在测试集上取得了78.3%的准确率(Accuracy),与不引入外部知识和引入多种外部知识的两个基线方法相比,分别提升了4.8%和3.0%。表明文章提出的知识筛选策略能有效地过滤噪声,且多通道信息融合推理框架能充分融合多知识源的信息进行常识推理。
- 单位