摘要

针对自然语言处理领域生成式文本摘要任务中存在的语义编码不充分、摘要语句不通顺问题,提出一种基于序列到序列(Seq2Seq)结构的生成式摘要模型TCAtten-GRU。采用双编码器对源文信息进行充分编码,应用时间卷积网络(TCN)获取全文的语义信息,卷积神经网络(CNN)提取文本的高层特征。解码器采用结合指针机制和集束搜索的门控循环单元(GRU)解决生成摘要不通顺问题。中文短文本摘要数据集LCSTS的实验结果表明,该模型与RNN、RNN content、MC-LSTM+atten和BiGRU-GRU+atten这4个模型对比,ROUGE-1提高了0.037-0.155,ROUGE-2提高了0.075-0.156,ROUGE-L提高了0.035-0.157,验证了该模型可以有效提升摘要质量。

全文