基于MapReduce的KMeans聚类算法的并行化实现

作者:张友海; 李锋刚
来源:九江学院学报(自然科学版), 2017, 32(01): 73-75.
DOI:10.19717/j.cnki.jjun.2017.01.019

摘要

聚类分析是数据挖掘的重要研究内容之一,在识别数据的内在结构方面具有重要的作用。目前,在大数据环境下,怎样更加有效地使用该方法来提取海量信息中的有价值的数据,是一个重要的研究方向。文章以常见的聚类算法Kmeans为例,介绍该算法的并行化实现。

全文