摘要
客服问答不同于社交评论,问答语料数据具有情感稀疏、专业性强、语气词少等特点,传统的机器学习和深度学习训练方法难以在少量稀疏数据集下获得很好的情感分类效果。为增强智能客服问答的情感判别、减少稀疏数据标注的代价,本文提出一种基于主动学习和多监督学习的情感分析模型,该模型融合了主动学习和多种监督模型,通过训练多个分类器并综合投票可显著提高分类成功率。另外,本文采用真实的税务客服问答数据,通过试验对多种文本分类方法进行对比,试验结果表明基于主动学习和多种监督学习的情感分析模型比现有的情感分析模型在小数据量上多分类准确率提高了3%。
-
单位航天信息股份有限公司