摘要
讽刺是一种复杂的隐式情感,讽刺检测是文本情感分析领域的重要研究问题,对于社交网络舆情分析有极强的现实意义。讽刺文本的表层语义和用户的真实情感往往相反,基于表层语义的文本情感检测通常会得到错误的分类结果。日常交流中的讽刺往往借助语调、神态等非文本信息进行表达,因此单纯基于文本语义的讽刺检测方法无法利用非文本信息,极大地制约了检测效果。为了充分利用文本语义与用户社交行为信息,提升讽刺检测效果,提出了一种基于文本语义和社交行为信息融合的讽刺检测方法。该方法构造了包含用户、文本、情感词的异质信息网络,并设计了一种用于异质信息图表征向量计算的图神经网络模型。该模型使用双重注意力机制提取社交行为信息,通过情感子图挖掘文本深层语义,最终得到融合文本语义和社交行为信息的融合特征向量。融合特征向量可以用于训练分类器,进而完成社交网络文本讽刺检测。在推特真实数据集上的充分实验表明,所提方法的分类效果优于现有的讽刺文本检测方法。
-
单位高等研究院; 上海交通大学