摘要
【目的】方面级情感分析能够更好地洞察用户评论,是近年来研究的热点。针对方面级情感分析领域中标签数据较难获取的问题,设计简单而有效的多级数据增强方法。【方法】在不改变情感极性的前提下,针对一个评论中特定几个目标方面进行句子级相邻词、领域级同类词和词向量级同义词替换,既保证了标签不变性,又能够生成多样化的合成训练样本。每种数据增强方法能够单独运用或者随机组合运用。【结果】提出的方案分别运用在基于注意力机制+预训练模型和基于依赖树+预训练模型上,并应用于对比学习框架。在SemEval 2014 Task 4 Sub Task 2上进行实验,实验结果表明提出的数据增强方法是有效的,Accuracy和Macro-f1指标优于基准指标。【结论】多级数据增强方法可以有效缓解方面级情感分析任务中数据不足问题,既可以作为原训练数据的有效补充实施共同训练,也可以构建正样本用于对比学习实施多任务训练。
-
单位江苏信息职业技术学院; 江南大学