摘要

利用核密度估计的非参数检验特性,提出了一种基于核密度估计的Kmeans改进算法KernelKmeans.该算法综合了基于划分的聚类思想以及基于密度的聚类思想,首先由核密度估计算法计算样本点的密度分布,然后对密度分布栅格进行窗口计算并取极大值来初步确定聚类中心以及聚类数量,最后将聚类中心和聚类数量作为参数输入Kmeans算法得到聚类结果.以OpenStreetMap发布的京津冀城市群点数据开展实验研究,采用算法运算时间与轮廓系数为验证指标,与Kmeans算法、极大极小改进Kmeans算法进行了对比验证,结果表明Kernel-Kmeans算法的精度高于后两者.