自适应密度峰值聚类算法

作者:张强; 周水生; 张颖
来源:西安电子科技大学学报, 2023, 1-13.
DOI:10.19665/j.issn1001-2400.20230604

摘要

密度峰值聚类(DPC)以其简单、高效的特点被广泛应用。然而,其有两个不足:1)集群密度不均匀和不平衡的数据集在DPC所提供的决策图中,很难识别真正的聚类中心;2)存在一个区域密度最高的点的错误分配将导致该区域内的所有点都指向同一个错误的聚类的“链式效应”。针对这两个不足,引入新的自然邻域(NaN)的概念,提出了一种基于自然邻域的密度峰值聚类算法(DPC-NaN)。算法使用新的自然邻域密度识别噪声点、选择初始预聚类中心点,将非噪声点按密度峰值方法进行分配得到预聚类;并通过确定预聚类的边界点和合并半径,自适应的将预聚类结果合并为最终聚类。所提算法无需人工预设参数,也缓解了“链式效应”的问题。实验结果表明,与相关聚类算法相比,所提出的算法可在典型的数据集上获得更好的聚类结果,同时在图像分割表现良好。

全文