摘要

微博情感分析指利用微博文本进行情感的自动分类。在对大规模的中文微博短文本进行分类时,存在着耗时长和一致性差等问题。针对以上问题,论文采用基于多分类器集成的self-training的半监督情感分类方法。在小规模的情感标注样本的基础上,使用多个分类器参与分类预测,通过设置子分类器的情感贡献权重来得到分类的情感置信度,选出置信度高的样本来扩大训练集,更新训练模型,从而提高情感分类的效率和准确性。并于传统的半监督情感分析方法进行比较,实验证明,论文算法具有更高的效率和准确性。