摘要
针对文本分类中长短时记忆网络在提取局部信息时存在的局限性问题,本文提出了融合LSTM-Attention和CNN的文本分类模型。在结构上,首先使用LSTM提取全局序列信息,并通过注意力机制对LSTM输出添加权重,再通过三层卷积神经网络提取原文的局部信息。此外,在卷积神经网络中采取的是串行结构并且有选择性地将原始输入信息与CNN输出相融合。然后,将两者的输出信息进行组合以得到全新特征并用Softmax得到每个类别的概率,最终在THUCNews数据集上准确率达到96.8%。通过实验对比发现,本文提出的模型在文本分类任务中可以得到更好的分类效果。
-
单位阜阳师范大学