聚类分析是数据挖掘的重要研究内容之一,在识别数据的内在结构方面具有重要的作用。目前,在大数据环境下,怎样更加有效地使用该方法来提取海量信息中的有价值的数据,是一个重要的研究方向。文章以常见的聚类算法Kmeans为例,介绍该算法的并行化实现。