摘要
情感分析能从用户言论中快速准确地挖掘用户的情感倾向,有着极大的应用市场。针对微博语言语法结构复杂多样的特性,提出了一种基于语法依存结构的图卷积神经网络(SGCN)模型对中文微博进行细粒度的情感分类。所提模型兼具结构表达和语义表达丰富的特点:基于词语间的依赖关系构建文本图,并通过点互信息(PMI)量化词语间的相关程度,作为相应边的权重以充分表现句子的结构信息;将融合位置信息的语义特征作为节点的初始特征,增加文本图中点的语义特征。为了验证所提模型的性能,在SMP2020(Social Media Processing 2020)微博情感分类数据集上,对两组包含开心、悲伤、愤怒、恐惧、惊讶和无情绪的6类微博情感数据进行了分析。实验结果表明,所提模型的平均F1分数可达到72.64%,相较于BERT(Bidirectional Encoder Representations from Transformers)词向量特征图卷积网络(BGCN)模型和文本级图神经网络(Text-Level-GNN)模型分别提高了2.75和3.87个百分点,验证了所提模型能更有效地利用句子的结构信息,提升模型的分类性能。
-
单位自动化学院; 中国民航大学; 中国科学院计算技术研究所