多模态语言舆情数据集构建与识别方法

作者:吕学强; 董良; 滕尚志*; 张乐
来源:北京信息科技大学学报(自然科学版), 2023, 38(05): 1-9.
DOI:10.16508/j.cnki.11-5866/n.2023.05.001

摘要

针对现有语言舆情领域缺乏研究数据集的问题,通过构建语言舆情信息源库,确立了语言舆情的信息来源和范围,并对其中包含的微博数据进行采集,以构建多模态语言舆情数据集。进一步提出了一种基于多模态融合的语言舆情识别方法,通过注意力机制增强单模态特征,并学习不同模态特征之间的依赖关系,以生成细粒度的多模态表示。实验结果表明,本文方法在准确率上优于现有的多模态分类方法,可有效识别出语言舆情信息。

全文