摘要

重叠社区结构是大型复杂网络的一个显著特征,在社区检测算法的基础上,研究人员提出了低时间复杂度的重叠社区检测算法。但是这些算法也存在着不足之处,如执行过程中存在着较大的随机性导致算法不稳定等。为了进一步优化重叠社区检测算法,提出了一种新的基于度和节点聚类系数的节点重要性定义,按照节点重要性降序更新节点,固定节点更新策略,提高社区检测的稳定性。在此基础上,提出了一种基于图嵌入和多标签传播的重叠社区检测算法(overlapping community detection based on graph embedding and multilabel propagation algorithm,OCD-GEMPA)。该算法结合node2vec模型对节点进行低维向量表示,构建节点之间的权重值矩阵,根据权重值计算标签归属系数,依此选择标签,避免了随机选择问题。在真实数据集和人工合成数据集上对该算法进行实验验证,实验结果表明,与其他重叠社区检测算法相比,OCD-GEMPA算法在EQ和NMI这两个指标都有明显提升,具有更好的准确性和稳定性。

全文