摘要
模型中总结并解释长篇上下文信息存在的困难,提出一种基于细粒度可解释矩阵,先抽取再生成的摘要模型(fine-grained interpretable matrix, FGIM),提升长文本对显著度、更新性和相关度的可解释抽取能力,引导系统自动生成摘要。该模型通过一个句对判别(pair-wise)抽取器对文章内容进行压缩,捕获文章中心度高的句子,将抽取后的文本与生成器相结合,实现摘要生成。在生成端通过可解释的掩码矩阵,控制生成摘要的内容属性,在编码器端分别使用多层Transformer和预训练语言模型BERT来验证其适用性。在标准文本摘要数据集(CNN/DailyMail和NYT50)上的实验表明,所提模型的ROUGE指标和人工评估结果均优于当前最好的基准模型。实验中还构建两个测试数据集来验证摘要的更新度和相关度,结果表明所提模型在可控生成方面取得相应的提升。
- 单位