摘要
多跳阅读理解是机器阅读理解的重要任务,旨在从多段文档中构造一条多跳推理链,以此结合多文档中证据回答问题.近年来,图神经网络广泛应用于多跳阅读理解任务,但仍存在多文档推理链的上下文互信息获取不充分、部分答案仅因为与题目相似就被误判为候选答案而引入噪声的缺陷.针对上述问题,文中提出用于多跳阅读理解的双视图对比学习网络(Dual View Contrastive Learning Networks, DVCGN).首先,提出基于异构图的节点级正负样本对比学习方法,对异构图进行节点级损坏和特征级损坏,构造双视图.被损坏的两个视图经图注意力网络迭代后生成两个更新后的视图,DVCGN通过最大化双视图节点表示相似性学习节点表示,获取丰富的上下文语义信息,精确建模当前节点表示及其与推理链其余节点关系,有效辨别多粒度上下文信息及干扰信息,为推理链构造更丰富的互信息.然后,提出问题引导的图节点剪枝方法,充分利用问题信息筛选答案实体节点,缩小候选答案范围,减弱证据句子中相似性表述带来的噪声.在HOTPOTQA数据集上的实验表明,DVCGN的性能较优.
- 单位