摘要

本发明公开了一种基于序列到序列模型的中文文本摘要生成方法,首先对文本进行按字切分并填充到固定长度,对字向量进行高斯随机初始化;将文本编码后输入双向长短期记忆网络(LSTM),最后的输出状态作为预编码;对字向量按照不同的窗口大小做卷积神经网络(CNN),输出作为窗口词向量;构建编码器,构造一个双向LSTM,预编码作为其初始化参数,上一步的窗口词向量作为输入;构建解码器,使用单向LSTM并结合注意力机制生成文本。本发明改进了传统的序列到序列模型中的编码器,使模型在编码阶段能够获得更多的原文本的信息,最终解码出更好的文本摘要,并使用了更小细粒度的字向量,更适合中文文本。