摘要
密度峰值聚类(DPC)是近年来提出的一种新的密度聚类算法,算法的核心是基于局部密度和相对距离,通过画出决策图,人为选定聚类中心,进而完成聚类。DPC算法利用截断距离计算局部密度,本质上只考虑了周围近邻节点的数量,且算法采用单步分配策略,一定程度上限制了算法对任意数据集的计算精度和有效性。针对上述问题,提出基于二阶k近邻的密度峰值聚类算法(SODPC)。算法通过引入节点的二阶k近邻,计算直接密度和间接密度,重新定义局部密度的计算方式。在此基础上,定义非中心节点的多步骤分配策略完成聚类。通过人工和真实数据的测试,证明了该算法对不规则、密度不均匀的数据集具有较好的聚类效果。
- 单位