摘要

针对传统K-means算法存在的随机选取初始聚类中心和类簇数目需要人为选定,从而导致聚类结果不稳定,容易陷入局部最优解的问题,文章提出了一种基于改进的密度峰值算法(DPC)的K-means算法,该算法首先采用改进的DPC算法来选取初始聚类中心,弥补了K-means算法初始聚类中心随机选取导致易陷入局部最优解的缺陷;其次运用K-means算法进行迭代,并且引入熵值法计算距离优化聚类。在UCI数据集上的实验表明,该算法得到较好的初始聚类中心和较稳定的聚类结果,并且收敛速度也较快,证明了该算法的可行性。

全文