摘要
多元文本情感分析旨在对文本表达的情感色彩进行划分,但目前多标签文本情感分类仍然存在数据集类别不平衡、提取特征不充分等问题.为了提高句子级文本的情感分类能力,提出一种基于异构分类器的集成学习方法 .基分类器分三种:基于自注意力机制的双向长短期记忆网络算法、基于词嵌入的卷积神经网络算法、基于文本信息熵的朴素贝叶斯算法,通过模糊积分算法确定各基分类器在待分类样本上的分类权重,最大程度地利用各分类器之间的联系与分类结果 .实验结果表明,提出的集成学习方法与目前先进的集成模型SentiXGboost,3WD-AdaCNN-SVM相比,各项指标均得到提升,结合欠采样和重采样技术构建的集成分类模型能对类别不平衡文本情感进行准确的分类.
-
单位江苏省海洋资源开发研究院