摘要

<正>1引言聚类是数据挖掘领域中的一项重要技术。聚类就是识别隐藏在数据中的类,通过聚类使得不同类中的数据对象之间具有较低的相似性,而在同一类中的数据对象之间具有较高的相似性。聚类方法大致可以分为基于划分的方法、基于层次的方法和基于网格的方法等。其中代表性的算法有K-means算法[]、String算法[1]、CLIQUE算法[2]、CURE算法[3]和DBSCAN算法[4]等。K-means是聚类分析中基于划分的聚类算法,该算法是一种确定k个中心