基于细粒度可解释矩阵的摘要生成模型

王浩男; 高扬<sup>*</sup>; 冯俊兰; 胡珉; 王惠欣; 柏宇

doi:10.13209/j.0479-8023.2020.082

摘要

模型中总结并解释长篇上下文信息存在的困难,提出一种基于细粒度可解释矩阵,先抽取再生成的摘要模型(fine-grained interpretable matrix, FGIM),提升长文本对显著度、更新性和相关度的可解释抽取能力,引导系统自动生成摘要。该模型通过一个句对判别(pair-wise)抽取器对文章内容进行压缩,捕获文章中心度高的句子,将抽取后的文本与生成器相结合,实现摘要生成。在生成端通过可解释的掩码矩阵,控制生成摘要的内容属性,在编码器端分别使用多层Transformer和预训练语言模型BERT来验证其适用性。在标准文本摘要数据集(CNN/DailyMail和NYT50)上的实验表明,所提模型的ROUGE指标和人工评估结果均优于当前最好的基准模型。实验中还构建两个测试数据集来验证摘要的更新度和相关度,结果表明所提模型在可控生成方面取得相应的提升。

单位
北京理工大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-04-18 01:24

基于细粒度可解释矩阵的摘要生成模型

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友