摘要

情感分类是一种从文本中提取情感倾向的文本分类任务。集成学习通过结合几个分类器,在情感分类任务上能够获得比个体分类器更好的分类效果。但是,由于个体分类器在数据集上的表现不同,个体分类器在集成方法中的权重难以确定。针对集成学习中个体分类器的权重优化问题,提出一种基于差分进化优化个体分类器权重的集成分类方法,并将其应用于中文情感分类。以分类准确率为适应度值,通过差分进化算法优化5种个体分类器的权重组合,在3个领域的评论语料集上进行实验。实验结果表明,与一般的集成方法相比,该方法在中文情感分类上有更好的分类效果。