摘要

针对短文本的文本分类出现的特征维度高和数据稀疏性的问题,本文提出了一种结合神经网络语言模型word2vec和文档主题模型LDA的文本特征表示模型,并使用表示矩阵模型,矩阵模型不仅可以有效地表示单词的语义特征,还可以表达上下文特征,增强模型的特征表达能力。将特征矩阵输入卷积神经网络(CNN)进行卷积池化,并进行文本分类实验。

全文