摘要
基于传统的K-均值(K-means)聚类算法,提出了一种通过优化初始聚类中心选取的改进K-均值聚类算法。改进之后的方法,首先计算所有数据中任意两点间的欧氏距离,通过比较距离大小,选取最小时的其中一点作为第1个初始聚类中心,在剩余的数据中,选择尽可能远离该点的数据点作为第2个初始聚类中心,依此类推,直至找到需要的k个点,然后再根据K-均值聚类算法迭代更新聚类中心,当达到最大迭代次数时停止。使用误差平方和(SSE)作为算法的评估标准,通过实验可知,提出的方法与传统的K-means聚类算法相比稳定性和准确率等方面有所提高。
- 单位