摘要

针对在社交网络中挖掘意见领袖存在计算复杂度高的难题,提出一种基于K核分解的意见领袖识别算法CandidateRank。该算法首先基于K核分解方法获取社交网络中的意见领袖候选集,缩小识别意见领袖的数据规模;然后提出用户相似性的概念,包括位置相似性和邻居相似性,利用K核值、入度数、平均K核变化率和用户追随者个数计算用户相似性,并根据用户相似性对候选集中的用户计算全局影响力;最后,根据用户全局影响力对意见领袖候选集中的用户进行排序,从而识别意见领袖。在实验部分使用独立级联传播模型(IC)和中心性两种评价指标在三个大小不同的真实数据集上对该算法选出的意见领袖集进行评估并与其他三种识别意见领袖的算法对比,选出的影响力TOP-15的用户平均影响力以21.442高于其他三个算法,另外,四种与K核相关的算法做相关性指标对比,CandidateRank算法效果较好,实验结果均表明CandidateRank算法在降低复杂度的基础上提高了准确度。