摘要

[目的/意义]解决现有突发公共卫生事件中虚假新闻检测存在的检测时效性弱、文本语义特征提取不全面问题。[方法/过程]从多粒度视角出发,通过预训练语言模型BERT抽取句子向量特征和字符向量特征,引入腾讯AI Lab开源词向量获取词语向量特征,再通过特征融合技术构建起富含多粒度信息的文本特征表示模型,最后利用卷积神经网络实现对融合特征的识别分类,以此构建起融合多粒度信息的虚假新闻检测模型MG-CNN。[结果/结论]本文提出模型的准确率、查全率和召回率分别为97.829%、97.592%和96.986%,其中F1值达到97.283%,较基线模型最大提升7.305%,较次优模型提升0.774%。融合多粒度信息特征的MG-CNN模型能够高效精准地检测出突发公共卫生事件中的虚假新闻。