融合BERT和卷积门控的生成式文本摘要方法

邓维斌<sup>*</sup>; 李云波; 张一明; 王国胤; 朱坤

doi:10.13195/j.kzyjc.2021.0494

摘要

结合注意力机制的循环神经网络(RNN)模型是目前主流的生成式文本摘要方法,采用基于深度学习的序列到序列框架,但存在并行能力不足或效率低的缺陷,并且在生成摘要的过程中存在准确率低和重复率高的问题.为解决上述问题,提出一种融合BERT预训练模型和卷积门控单元的生成式摘要方法.该方法基于改进Transformer模型,在编码器阶段充分利用BERT预先训练的大规模语料,代替RNN提取文本的上下文表征,结合卷积门控单元对编码器输出进行信息筛选,筛选出源文本的关键内容;在解码器阶段,设计3种不同的Transformer,旨在探讨BERT预训练模型和卷积门控单元更为有效的融合方式,以此提升文本摘要生成性能.实验采用ROUGE值作为评价指标,在LCSTS中文数据集和CNN/Daily Mail英文数据集上与目前主流的生成式摘要方法进行对比的实验,结果表明所提出方法能够提高摘要的准确性和可读性.

单位
重庆邮电大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-19 07:46

融合BERT和卷积门控的生成式文本摘要方法

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友