摘要

近年来,随着网络技术的不断发展,微博作为一种社交工具越来越受到人们的喜爱。由此在微博上产生大量的包含个人情感的文本信息,而这些带有个人情感的文本信息对网络舆论的传播产生巨大影响,所以对微博文本的分析研究变得十分紧迫。针对于此,提出一种LSTM与CNN的混合模型对文本分类。首先,基于Word2Vec的词向量训练方法以克服传统文本向量表示方法中高维度和高稀疏性的问题;进一步,通过TF-IDF模型对词向量进行加权赋值以确定词向量的重要程度;最后,以加权运算后的词向量作为初始输入样本来对LSTM与CNN混合模型进行分类训练,进而自动提取出文本信息中的隐含特征,实现对微博评论数据的准确分类。实验结果表明,该方法能够显著提高对微博文本内容的分类准确率,进而有效预测微博舆论的传播趋势。