摘要

经典K-means算法在数据分布不均匀的情况下,随机选择初始聚类中心点会导致结果不稳定,文章针对上述问题提出了一种稳定算法。采用距离计算数据样本空间密度,令密度最大区域簇内误差平方和最小点作为第一个初始聚类中心,删除以该样本点为中心,平均距离为半径的数据集,对剩余数据集继续采用上述方法查找初始聚类中心,重复上述过程直至找到K个聚类中心点。使用UCI数据集和经典聚类算法实验结果进行对比,实验结果表明算法能够快速找到聚类初始区域中心点,避免随机初始中心点对算法的影响,从而提升聚类准确性和算法的稳定性。

  • 单位
    六盘水师范学院