融合内容特征与传播特征的微博文本情感分类

陈红阳; 黄正洪; 何盈盈; 周也力

摘要

基于Word2vec的文本向量化表示方法未充分考虑微博文本的内容特征与传播特征，导致文本向量化表示欠佳，且采用单个机器学习算法进行情感分类的精度不高。提出一种融合文本中表情符号，词的语义、词性与情感等内容特征，评论、转发与点赞数等传播特征，共同构建蕴含丰富语义与情感信息的文本特征向量。根据各基分类器在训练数据集上的性能表现设置不同权重，并与类概率向量相乘，保留最大、最小与平均加权概率值，同时结合原始文本特征向量作为元分类器的输入数据以改进原Stacking算法，进行微博文本情感分类。在微博数据集上的实验结果表明：本文方法能更好地表示文本向量，以加权方式改进的Stacking集成学习分类器优于单个分类器；相较于其他情感分类方法，本文方法的准确率提升1.75%～4.90%。

单位
成都理工大学; 重庆人文科技学院

收藏分享被引浏览

更新时间：2024-03-19 05:52

融合内容特征与传播特征的微博文本情感分类

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友