摘要

针对单一的FastText模型在不平衡中文语料中的情感极性分析效果不好,以及传统Jieba分词对广领域中文文本适应性不强,数据倾斜导致中文情感极性分析的准确率和召回率产生波动等问题,提出一种基于Borderline-Smote算法改进的FastText中文情感极性分析,通过过采样Borderline-Smote和pkuseg中文分词等预处理方式分别解决分类中数据倾斜、涉及领域广的问题,再与FastText结合进行中文情感极性分析。实验结果表明,该模型在中文情感极性分析中的准确率得到了一定的提高。