摘要

基于机器学习的文本分类方法通常忽略了文本上下文内容的语义特征,基于深度学习的文本分类方法虽考虑了上下文内容的语义特征,但弱化了实体信息在文本分类中的作用,无法丰富文本语义表示,突出文本内容特征.本文融合实体信息,提出一种循环神经网络与实体表示相结合的分类模型.该模型通过循环神经网络和Attention机制对文本进行建模表示,充分挖掘文本上下文内容的语义特征;同时,将实体表示与文本表示做注意力计算,进一步丰富文本语义与内容特征.在20NG、R8、IMDB、AG News四个数据集上进行实验,实验结果显示,该模型与其他主流基线方法相比,在准确率(Accuracy)上取得显著提高.