摘要
序列到序列模型是文本摘要研究领域应用最广泛的方法。但在此方法中,文本语言特征没有得到充分利用,摘要句存在词语丢失和词语重复问题,影响文本摘要的准确性和可读性。为此,论文提出基于特征融合和局部注意力相结合的摘要生成方法FCLA(Feature Combination and Local Attention)模型。利用评论文本的语言特征,提取多个文本特征加以改善输入的特征,建立领域专有词典,利用斯坦福glove词向量作为词嵌入,改进序列到序列模型,在输入层及隐藏层注入位置权重的局部注意力机制,改善生成摘要句效果。论文采用公开的亚马逊商品评论数据集进行实验,结果表明所提出的模型能够有效地提高生成摘要的准确率,可应用于文本摘要任务。
- 单位