由于现如今互联网产生数据规模爆炸式增长,传统数据挖掘算法已经无法满足目前研究者的需求,需要对传统算法融入新的技术。为此,文章选取Hadoop与传统的聚类算法K-means进行研究并加以实验,实验结果良好,能够有效提高聚类结果的准确率和聚类效率。