摘要

谣言的及时发现和有效管控,是互联网+政务服务中公共舆情治理的重要组成部分。互联网和移动互联网的发展,提高了民众沟通交流的便利度,同时也加速了谣言的传播速度和广度,极大地提高了谣言的影响力和危害力,对民众的生产生活带来干扰、也严重影响社会秩序。现有的网络平台辟谣工作大多建立依赖于人工举报筛查,不仅耗费大量的时间和精力,也往往在谣言扩散至一定规模时才引起有关部门工作人员注意。而利用数据挖掘、机器学习技术实现的谣言检测算法大多基于文本信息,常用于追溯性谣言检测,不适用于谣言扩散早期数据量不足的情况。此外,目前的相关研究也集中于社交媒体类应用消息中的谣言检测,方法难以迁移至其他类型的应用。首先收集最新的网络平台数据,根据辟谣平台查证结果进行标注并构造数据集Weibo 2020,对其中用户特征分布进行统计分析,选择具有代表性的用户特征并提出了基于传播用户代表性特征学习的早期谣言检测方法(Representative Propagation Path Classification, RPPC),并通过实验测试RPPC的有效性。实验结果表明,RPPC与同样基于传播路径的算法在同等条件下,在输入数据规模减少了50%的同时,提高了2%的准确率,能对5分钟内发布的消息进行检测,快速发现互联网内容中的疑似谣言且准确率达到近80%,并扩展了迁移至其他类型应用的可能性。因此可以认为提出的方法能够在消息传播初期有效过滤出疑似谣言,且具有跨平台应用的可能性,能够从一定程度上辅助政府部门的舆情治理工作,从而提高政务服务的时效及质量。