摘要

阐述一种基于Spark的分布式计算模式,它实现社群划分Louvain算法,使用开源海量数据集进行结果验证和统计,分析了该算法在分布式大数据环境情况下的适应性。