摘要
情感分析作为自然语言处理的细分研究方向经历了使用情感词典、机器学习和深度学习分析的发展过程。针对使用一般化的深度学习模型作为文本分类器对于特定领域的网络评论类型的文本的分析精准度较低、训练时发生过拟合的现象以及情感词典覆盖率低、编纂工作量大的问题,本文提出了基于情感词典和堆积残差的双向长短期记忆网络的情感分析方法。首先,借助情感词典中情感词的设计覆盖“教育机器人”研究领域内的专业词汇,从而弥补双向长短期记忆网络(Bi-LSTM)模型在分析此类文本时精准度不足的情况;然后,使用Bi-LSTM和SnowNLP来降低情感词典的编纂体量,长短期记忆网络(LSTM)的“记忆门”“遗忘门”结构可以在保证充分考虑评论文本中的前后词语的关联性的同时,适时选择遗忘一些已分析词语,避免反向传播时梯度爆炸的问题,而在将堆叠残差的Bi-LSTM引入后,不仅使得模型的层数加深至8层,而且残差网络还减少了叠加LSTM时会导致的“退化”问题;最后,通过适当设置和调整两部分的得分权重,使用sigmoid激活函数标准化到[0,1]的区间上,按照[0,0.5],(0.5,1]的区间划分分别表示负面和正面情绪,完成情感分类。实验结果表明,通过使用本文提出的分类算法对于关于“教育机器人”评论数据集的情感分类准确率相较于标准的LSTM算法提升了约4.5%,相较于BERT提升了约2%。综上,本文将基于情感词典和深度学习模型的情感分类方法一般化,通过修改情感词典中的情感词汇并适当调整深度学习模型的结构和层数,可以应用于电子商务平台中各类商品的购物评价的精确情感分析,从而帮助企业洞悉消费者的购物心理和市场需求,同时也可以为消费者提供商品质量的一种参考标准。
- 单位