摘要

随着互联网和在线社交媒体的快速发展,社交网络中的信息传播十分迅速并难以掌控,社交网络中信息传播的规律研究需要进行大量的网络传播计算实验.当前以SIR模型为基础的网络传播实验广泛应用于疾病传播研究和信息传播研究.目前受限于硬件、软件等原因还很难进行超大规模的网络传播计算.然而当前互联网信息传播呈现出用户规模大、信息多、传播速度快的特点,以往基于抽象简化方法设计的小规模网络传播实验渐渐难以满足日益增长的计算需求.本文借助Spark平台,实现了超大规模网络传播计算实验算法,将该算法与Nepidemix单机传播计算组件进行了性能对比,论证了其优势和不足.该算法在有足够集群计算资源时可以进行上亿规模节点的网络传播实验,并且开发难度小,基于此可以高效地进行大规模复杂网络中的信息传播仿真,为舆情传播、监测、预测和干预等研究奠定了基础.