摘要
图神经网络(Graph Neural Network,GNN)模型由于采用端到端的模型架构,训练过程中能够更好的将节点隐藏特征的学习和分类目标协同起来,相比之前图嵌入(Graph Embedding)的方法在节点分类等任务上得到了较大的性能提升. 但是,已有图神经模型实验对比阶段普遍存在的数据集类型单一、样本量不足、数据集切分不规范、对比模型规模及范围有限、评价指标单一、缺乏模型训练耗时对比等问题. 为此,本文选取了包括cora、citeseer、pubmed、deezer等在内的,来自不同领域(引文网络、社交网络及协作网络等)的共计20种数据集,以准确率、精确率、召回率、F-score值及模型训练耗时为多维评价指标,在FastGCN、PPNP、ChebyNet、DAGNN等17种主流图神经网络模型上,进行了全面且公平的节点分类任务基准测评,进而为真实业务场景下的模型选择提供决策参考. 通过基准测试实验发现:一方面,影响模型训练速度的因素排名依次是节点属性维度、图节点规模及图边的规模;另一方面,并不存在赢者通吃的模型,即不存在在所有数据集下全都表现优异的模型,特别在公平的基准测试配置环境下,模型结构简洁的反而比复杂的GNN模型有着更好的性能表现.
- 单位