摘要

随着大数据技术的成熟,如何提高大规模数据的分析效率成为了目前的热点。为了提高在大规模数据下进行分析的效率,通过MapReduce运行仿射传播聚类算法实现并行化分析,增加精准度,详细论述了实现的过程以及关键技术。实验表明,该方法取得了良好的实验效果,克服了传统方法耗时多、识别率低等问题,是实现在大规模数据中进行分析的实用工具。