摘要

针对社交网络影响最大化算法存在的在大规模社交网络中没有充分考虑网络中有向拓扑结构、对I/O的访问次数过高、选择的初始激活节点聚集程度较高等问题,提出一种基于分区的有向超团模式的社交网络影响最大化算法。该算法首先发现社交网络中的极大连通子图,并从每个子图内发现关联规则,以减少I/O次数。从每个子图中分别挖掘社交网络中的有向超团,引入Apriori的改进算法发现有序频繁集,并从有序频繁集中挖掘关联规则;之后在关联规则的基础上结合节点的度数对种子节点进行选取,将选出的种子节点在独立级联模型上进行传播。其中,由于传统的Apriori算法仅适用于从无序项集中发现频繁集,因此对项集合并时的重组规则进行改进,使其适用于发现有序频繁集。采用KDD2012数据集进行了实验,结果表明:该模型在很大程度上避免了节点影响所产生的重叠效果,进而取得比现有启发式算法更优的影响效果;初始激活节点小于1 000时,该算法最终影响节点数可以达到最新影响力算法(k-核算法)的两倍。