摘要

案件微博评论的情绪分类是一个特定领域的情感多分类任务,旨在快速有效地识别海量评论中的情绪,有助于相关部门及时评估舆情风险和制定相关政策.由于传统方法难以有效利用评论中常用的情绪词和表情符号等情绪知识,本文提出一种融合情绪知识的案件微博评论情绪分类方法.首先,整合现有的情感计算资源构建了一个包含案件微博情绪词典、表情符号、网络用语、否定词及程度副词等的情绪知识库.其次,考虑情绪知识库和词性的作用定义了15种情绪知识,通过提出的连续向量表示方法构建评论的情绪知识表示.然后将评论的语义表示和情绪知识表示分别输入一个语义初始化滤波器的卷积神经网络(INIT-CNN)和一个结合注意力机制的全连接网络中,得到深层的语义特征向量和情绪知识表示的注意力特征向量.最后,将两个特征向量进行拼接以融合语义特征和情绪知识特征,训练一个情绪分类模型,称为EK-INIT-CNN(Emotional knowledge enhanced INIT-CNN).在案件微博评论数据集上的实验表明,相比INIT-CNN,EK-INIT-CNN的MacroPrecision、MacroRecall和MacroF1指标分别提升了1.87%、1.95%和1.88%.EK-INIT-CNN在NLPCC中文微博情绪分析评测数据集上的性能则超过了目前已知文献中的最好结果.实验证明,该方法能有效地融入外部情绪知识,且相对传统方法在情绪分类任务上具有明显的优势.