摘要
情感分类旨在对文本所表达的情感色彩进行分类。为了提高句子级别的情感分类能力,提出一种基于异构分类器集成学习的方法,主要采用2种文本特征提取的3种主流情感分类集成方法:基于词嵌入的长短期记忆网络(long short term memory, LSTM)、基于词嵌入的卷积神经网络(convolutional neural networks, CNN)和基于词频-逆文档频率(term frequency–inverse document frequency,TF-IDF)的逻辑回归(logistic regression,LR)方法。为了避免传统投票法的单一性和软投票法不能应用在异构分类器上进行集成学习分类的问题,采用回归学习多分类器输出标签方法,从而使各分类器的数据价值最大化,进而有利于对文本所表达的情感色彩实现分类。实验结果表明,本文提出的方法比3种主流方法在准确率和F1值上分别提高了4.7%和5.2%且优于传统投票法。
- 单位