摘要

在高维数据空间中,数据大都处于高维空间边缘且分布十分稀疏。由此引起的“维度灾难”导致现有异常检测方法无法保证其异常检测精度。为解决该问题,本文提出一种基于角度的图神经网络高维数据异常检测方法(A-GNN)。该方法首先通过数据空间的均匀采样和初始训练数据的扰动扩充用于训练的数据;然后利用k近邻关系构造训练数据的k近邻关系图(k-NNG),并以k近邻元素距离加权角度的方差作为近邻关系图节点的初始异常因子;最后,通过图神经网络模型的训练,近邻节点间的信息交互让节点互相学习以实现有效的异常评估。与9种现有方法在6个自然数据集上进行实验对比,本文方法在5个数据集中取得了最高的AUC值。实验结果表明:A-GNN能够大幅提高各种维度数据的异常检测精度,在一些“真高维”数据集上异常检测的AUC提高达40%以上,表现突出。在不同k值下与3种基于k近邻异常检测方法的比较实验验证了利用图神经网络节点间的信息交互能有效避免k值对检测结果的影响,具有更强的鲁棒性。

全文