基于K近邻和多类合并的密度峰值聚类算法

作者:薛小娜; 高淑萍; 彭弘铭; 吴会会
来源:吉林大学学报(理学版), 2019, 57(01): 111-120.
DOI:10.13413/j.cnki.jdxblxb.2017479

摘要

针对密度峰值聚类(DPC)算法在处理结构复杂、维数较高以及同类中存在多个密度峰值的数据集时聚类性能不佳的问题,提出一种基于K近邻和多类合并的密度峰值聚类(KM-DPC)算法.首先利用定义的密度计算方法描述样本分布,采用新的评价指标获取聚类中心;然后结合K近邻思想设计迭代分配策略,将剩余点准确归类;最后给出一种局部类合并方法,以防将包含多个密度峰值点的类分裂.仿真实验结果表明,该算法在22个不同数据集上的性能明显优于DPC算法.

全文