中文机器阅读理解的鲁棒性研究

作者:李烨秋; 唐竑轩; 钱锦; 邹博伟; 洪宇*
来源:北京大学学报(自然科学版), 2021, 57(01): 16-22.
DOI:10.13209/j.0479-8023.2020.088

摘要

为了更好地评价阅读理解模型的鲁棒性,基于Dureader数据集,通过自动抽取和人工标注的方法,对过敏感、过稳定和泛化3个问题分别构建测试数据集。还提出基于答案抽取和掩码位置预测的多任务学习方法。实验结果表明,所提方法能显著地提高阅读理解模型的鲁棒性,所构建的测试集能够对模型的鲁棒性进行有效评估。

全文