摘要

社区发现是数据挖掘的重点问题之一,社区发现有助于提取数据中隐含的信息和知识,对链路预测、关键节点识别以及个性化推荐等提供有力支撑。多源异构数据一般由多种类型的实体对象和关系组成,具有格式异构、语义多样等特征,异构信息网络可以更好地挖掘数据中的语义信息。针对如何充分利用异构信息网络中丰富的语义信息,提出一种融合多条元路径的社区发现算法。算法综合考虑多条不同元路径下的语义信息,组合多条元路径度量任意节点间的相似性,计算节点的重要性,选取种子节点进行拓展完成初始社区划分,基于种子社区进行标签拓展优化,最终完成社区划分。在真实数据集上进行仿真实验,实验结果表明该算法针对异构信息网络可以得到较好的社区发现结果。