摘要
随机选取初始聚类中心和根据经验设置K值对K-means聚类结果都有一定的影响,针对这一问题,提出了一种基于加权密度和最大最小距离的K-means聚类算法,称为KWDM算法。该算法利用加权密度法选取初始聚类中心点集,减少了离群点对聚类结果的影响,通过最大最小距离准则启发式地选择聚类中心,避免了聚类结果陷入局部最优,最后使用准则函数即簇内距离和簇间距离的比值来确定K值,防止了根据经验来设置K值。在人工数据集和UCI数据集上的实验结果表明,KWDM算法不仅提高了聚类的准确率,而且减少了算法的平均迭代次数,增强了算法的稳定性。
- 单位