摘要
本发明提供了一种基于全局语义的文本自动摘要方法、装置、介质及设备。其中方法包括如下步骤:将原始文本的内容进行预处理,按照字节进行划分,并对其中的大写字母替换成小写字母,得到文本信息;编码器基于卷积神经网络和自注意力机制对文本信息进行全局编码,并经过一个控制单元进行筛选,得到最终编码输出结果;解码器基于重复惩罚机制对编码输出结果进行解码,并生成文本摘要。本发明通过在编码器中加上卷积过滤器,并在解码器部分使用重复惩罚机制对重复词进行进一步抑制;可提高摘要文本语义的通顺度,重复惩罚机制可以对已经出现过的词的进行极大的抑制,减少生成摘要的重复性问题从而提高生成摘要的可读性。
- 单位