摘要

微博等社交网站吸引了全球数百万用户,在给大众带来便利的同时,也造成了许多问题,包括可能通过虚假账户向其他用户传播恶意内容。因此,虚假用户检测是追踪和缓解互联网网络威胁的一项基本而关键的任务。本文旨在解决当前虚假用户检测系统的两个主要局限性。首先,现有的虚假用户检测方法忽略了社交网络的结构信息,从而导致误检测。其次,社交网络结构一般只包含单个属性,在数据缺失时表现不佳。本文提出了一种新型的虚假用户检测方法,将细粒度网络流(如用户基本属性、文章特征)作为多属性社交图进行模型化,并将虚假用户检测问题转换为图上节点分类任务。实验结果证明,该算法对提高虚假用户检测性能有较明显的作用。

全文