基于网格密度距离的K-means优化算法

作者:张佳; 杨呈永; 崔建明; 智春
来源:桂林理工大学学报, 2022, 42(02): 502-506.
DOI:10.3969/j.issn.1674-9057.2022.02.028

摘要

针对传统K-means算法初始中心选取的随机性导致算法聚类效果不佳的问题,提出一种基于网格密度距离的K-means算法,即GDD-K-means。该算法先把数据点放入网格空间内,以网格为单元进行数据处理,遍历网格得到网格密度,根据密度阈值筛选出高密度网格并进行降序排序;再在高密度网格中引入K-means++思想,选取k个距离较远的网格点;最后进行K-means算法聚类的k个初始中心点将确定在上述网格点中。仿真实验结果表明,GDD-K-means算法减少了聚类中心选取的随机性,改善了聚类的效果。

全文