基于Deep Q-Learning的抽取式摘要生成方法

作者:王灿宇; 孙晓海; 吴叶辉; 季荣彪; 李亚东; 张少如; 杨士豪*
来源:吉林大学学报(信息科学版), 2023, 41(02): 306-314.
DOI:10.19292/j.cnki.jdxxp.2023.02.013

摘要

为解决训练过程中需要句子级标签的问题,提出一种基于深度强化学习的无标签抽取式摘要生成方法,将文本摘要转化为Q-learning问题,并利用DQN(Deep Q-Network)学习Q函数。为有效表示文档,利用BERT(Bidirectional Encoder Representations from Transformers)作为句子编码器,Transformer作为文档编码器。解码器充分考虑了句子的信息富集度、显著性、位置重要性以及其与当前摘要之间的冗余程度等重要性等信息。该方法在抽取摘要时不需要句子级标签,可显著减少标注工作量。实验结果表明,该方法在CNN(Cable News Network)/DailyMail数据集上取得了最高的Rouge-L(38.35)以及可比较的Rouge-1(42.07)和Rouge-2(18.32)。

全文