摘要

针对当前数据规模不断增大,单机的数据挖掘运行效率低下的问题,本文采用Hadoop平台对聚类K-means算法进行研究以解决此类问题。首先对Hadoop平台的架构和搭建进行了详细描述;其次详细分析了K-means算法;最后给出了算法实现,并对算法进行了实验分析。

全文