摘要
为研究社区结构对网络表示学习的影响,提出了一种新颖的融合社区结构信息的网络表示学习算法(CINE)。通过借鉴模块度思想,将社区结构吸收到基于矩阵分解的模型中以保留网络内部的社区结构;设计一个整体的目标函数,在捕获社区结构信息的同时也融合了节点间的1阶2阶邻近性信息和节点的属性信息,最终得到包含原始网络中3类信息的节点表示;采用Cora、Citeseer和Wiki等3个公开网络数据集验证CINE在节点分类、链接预测和可视化任务中的表现。结果表明:在3个数据集的分类任务中,CINE的Micro-F1分数分别达到了0.900 2、0.840 2、0.761 9,优于所有对比算法;在Cora数据集的链路预测任务中,CINE的AUROC得分比Node2vec、DeepWalk和TADW等算法分别提高了1.165、1.144和1.059倍。说明CINE在保留网络的结构和属性信息的基础上,捕获了社区结构信息,使得所学节点表示可以更好地执行后续的网络分析任务。
-
单位生命科学学院; 天津工业大学