摘要
一篇新闻文本中通常包含数十至数百个词语,其中有许多与分类无关的词语,它们会对分类性能产生影响。为此,论文提出了一种结合注意力机制的文本分类方法。在经典的卷积神经网络(CNN)文本分类模型的基础上,引入了注意力机制,考虑了不同词语对于分类的贡献度大小,提供了更加丰富的文本特征表达。实验在清华大学自然语言处理中文文本分类数据集上进行,研究了注意力机制的引入对于CNN文本分类模型的影响。实验结果表明,在引入了注意力机制以后,相较于经典的CNN文本分类模型,分类效果得到了一定的提升。
-
单位南京烽火星空通信发展有限公司; 武汉邮电科学研究院