摘要
近年来数据挖掘在电信领域的应用越来越广泛,而自中心网络从人与环境交互的角度为数据分析提出了新的思路,但是由于数据量、数据维度、计算复杂度等原因,传统的计算方式不能应付海量数据的自中心网络生成和分析的需求。本文首先给出了基于mapreduce模型的传统自中心网络生成算法的实现,然后提出了新的基于三角形提取自中心网络生成算法,并给出了基于mapreduce编程模型的实现,该算法针对mapreduce模型和真实的社会网络进行了优化并实现性能提升,最后对两种算法进行了运行时间和IO的比较。
-
单位网络与交换技术国家重点实验室; 北京邮电大学