摘要
本文主要研究了初始聚类中心选取对于K-means算法性能的影响,并通过更好的初始化技术来增强算法性能。研究发现,在进行K-means聚类时,通过使用加权距离密度计算方法,对数据集的密度计算,使得在传统K-means聚类算法过程局部最优、簇内方差较大所带来的聚类结果不佳的缺陷得到了显著改善。实验结果表明,在使用本改进方法进行聚类时,聚类结果的簇内方差较传统方法降低了15%左右,对聚类中心的聚集性更加紧密,使算法性能得到了较好的提升。
-
单位自动化学院; 昆明理工大学