融合多元用户特征和内容特征的微博谣言实时检测模型

作者:黄学坚; 王根生; 罗远胜; 闵潞; 吴小芳; 李志鹏
来源:小型微型计算机系统, 2022, 43(12): 2518-2527.
DOI:10.20009/j.cnki.21-1106/TP.2021-0277

摘要

针对目前基于单文本语义特征深度学习的微博谣言实时检测模型泛化能力不足的问题,提出一种融合多元用户特征和内容特征的实时检测模型.首先,在传统用户基本特征和内容统计特征的基础上,利用用户的历史行为数据,挖掘用户理性值和用户专业度两个深层次特征;然后,基于词向量和带有注意力机制的双向GRU神经网络构建文本语义特征学习模型;最后,采用分层特征级联和全连接的方式进行特征融合,把融合特征输入分类模型进行训练.实验结果表明,该模型的检测准确率达到了91.74%,相比其他只关注文本语义特征的深度学习实时检测模型具有更好的识别效果,相比于其他改进型的实时检测模型F1-Measure值也提高了2.19%.