摘要

最近,通过对比学习,自监督学习在图神经网络(Graph Neural Network, GNN)中显示出巨大的潜力,其目的是区分数据集中的每个节点或实例。然而,对比学习中通常将锚节点增广的样本视为正样本,其余样本都视为负样本,存在被打错标签的“伪负样本”问题,即一些被人为设定的负样本实际上是正样本,这会带偏模型学习效果。为了解决这一问题,本文提出了一种新的自监督对比学习框架FD4GCL,该框架可以渐进检测并纠正伪负样本。具体来说,在属性感知方面,建立了一种随训练过程自适应演变的属性阈值计算方法,通过计算节点间的属性相似度,根据属性阈值检测伪负样本;结构感知方面,鉴于图结构的不变性,设置结构阈值,计算节点间的结构相似度,根据结构阈值检测伪负样本,纠正大量的伪负样本有助于学到泛化性更强的节点表示。在多个数据集上进行了多次实验,用节点分类作为下游任务对模型进行评估,实验结果表明FD4GCL在三个引文数据集上相比次优方法节点分类准确率平均提升了1%,在其余数据集上相比次优方法平均提升了0.5%。