摘要

在面临突发大型公共事件时虚假信息的广泛传播将具有极大的破坏性。虚假信息的传播将严重干扰疫情的救治工作,针对以往传统分类模型存在特征稀疏,准确率不高等问题。提出了一种基于Word2Vec的疫情虚假信息检测方法。该方法使用Word2Vec模型训练词向量,解决了传统向量空间模型的特征稀疏问题,再引入TFIDF对词向量进行加权,最终将处理过后的数据输入到SVM模型。通过在国内新闻平台爬取的数据集上的实验验证,该方法较之传统方法,对虚假信息的检测在准确率上有4%以上的提升。