多目标情感分类中文数据集构建及分析研究

刘鹏远<sup>*</sup>; 田永胜; 杜成玉; 邱立坤

摘要

目标级情感分类任务是为了得到句子中特定评价目标的情感倾向。一个句子中往往存在多个目标,多个目标的情感可能一致,也可能不一致。但在已有针对目标级情感分类的评测数据集中:(1)大多数是一个句子一个目标;(2)在少数有多个目标的句子中,多个目标情感倾向分布并不均衡,多个目标情感一致的句子占较大比例。数据集本身的缺陷限制了模型针对多个目标进行情感分类的提升空间。针对以上问题,该文构建了一个针对多目标情感分类的中文数据集,人工标注了6 339个评价目标,共2 071条数据。该数据集具备以下特点:(1)评价目标个数分布平衡;(2)情感正负极性分布平衡;(3)多目标情感倾向分布平衡。随后,该文利用多个目标情感分类的主流模型在该数据集上进行了实验与比较分析。结果表明,现有主流模型尚不能对存在多个目标且目标情感倾向性不一致实例中的目标进行很好的分类,尤其是目标的情感倾向为中性时。因此多目标情感分类任务具有一定的难度与挑战性。

单位
北京语言大学; 闽江学院

收藏分享被引浏览

更新时间：2024-04-18 11:25

多目标情感分类中文数据集构建及分析研究

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友