摘要

学术社交网络中的某些学者可能组成异常引用群体,相互之间过度引用彼此的文章以谋取利益。现有的异常群体检测算法大多将社区检测与节点表示学习分离,导致最终异常群体检测性能受限。为此提出了一种基于局部扩展社区发现的异常引用群体检测算法GADL。该方法利用论文研究领域、标题内容等语义信息提取作者异常引用特征;定义了基于节点转移相似度、节点社区隶属度、引用异常度和BFS深度的扩展度量函数;将异常社区发现和异常节点检测结合,在统一框架下对二者进行联合优化,可获得最优的异常检测性能。在真实数据集上进行实验,结果表明该方法可有效地检测异常学术引用。