摘要

传统的短本文分类方法不仅会造成特征向量的高稀疏性及维度灾难,而且还不能准确表达语序信息,采用改进卷积神经网络(ICNN)能够对文本特征进行有效挖掘,长短期记忆神经网络(LSTM)能够实现语序的准确表达,为此提出了基于LSTM-ICNN的短文本分类技术研究。首先,为了提高传统卷积神经网络的特征提取能力,引入了三种卷积核因子,提高了短文本特征信息的获取量。然后,由于LSTM具有优秀的字词序列语义表达效果,所以提出了基于LSTM-ICNN的短文本分类方法,该方法解决了短文本分类时特征量较少及语序表达不准确的问题。实验对比分析显示,在相同条件下,相比于其他传统的分类算法, LSTM-ICNN的短文本分类准确度最高,而且与现有研究成果相比, LSTM-ICNN方法具有明显优势,验证了本文所提方法的有效性和实用性。