摘要
针对传统K-means算法初始中心选取的随机性导致算法聚类效果不佳的问题,提出一种基于网格密度距离的K-means算法,即GDD-K-means。该算法先把数据点放入网格空间内,以网格为单元进行数据处理,遍历网格得到网格密度,根据密度阈值筛选出高密度网格并进行降序排序;再在高密度网格中引入K-means++思想,选取k个距离较远的网格点;最后进行K-means算法聚类的k个初始中心点将确定在上述网格点中。仿真实验结果表明,GDD-K-means算法减少了聚类中心选取的随机性,改善了聚类的效果。
-
单位桂林理工大学; 现代教育技术中心