摘要
针对现有的情感分类方法普遍未能充分考虑用户个性化特征且忽略时间因素对情感分类结果的影响的问题,提出一种基于知识蒸馏和评论时间的文本情感分类新方法。首先,为解决数据集中高质量标注数据较少的问题,采用RoFormer-Sim生成模型对训练文本数据增强;然后,引入评论时间属性,从用户历史评论中提取用户的个性化信息,提出基于多特征融合的评论文本情感得分预测模型;最后,为提高针对冷启动用户的泛化性能,引入知识蒸馏理论,利用SKEP模型对基于多特征融合的情感分类模型进行通用性增强。在从中文股吧爬取的真实数据集上的实验结果表明,与SKEP、ELECTRA等典型方法相比,本文方法在准确率上分别提高了3.1%和0.9%,在F1值上分别提高了2.7%和1.0%,验证了其在改善情感分类表现方面的有效性。
- 单位