摘要

在图结构数据上开展推理计算是一项重大且普遍存在的任务,该任务的主要挑战是如何表示网状知识使机器可以快速理解并利用图数据。通过对比发现,当前基于随机游走方法的表示学习模型容易忽略属性对节点关联的特殊作用。据此提出一种基于节点邻接关系与属性关联关系的混合随机游走方法,其基本思想是首先通过邻接节点间的共同属性分布计算属性权重,获取节点到每个属性的采样概率,然后分别从邻接节点与含有共有属性的非邻接节点中提取网络信息。最后构建了基于节点-属性二部图的网络表示学习模型,通过上述采样序列学习得到节点向量表达。在Flickr、BlogCatalog、Cora公开数据集上,用该模型得到的节点向量表达进行节点标签分类的Micro-F1平均准确率为89.38%,比GraphRNA高出了2.02个百分点,比经典工作DeepWalk高出了21.12个百分点,且通过对比不同随机游走方法发现,提高对节点关联有促进作用的属性的采样概率,可以提高采样序列所含信息。