摘要
密度峰值聚类算法(DPC)能够有效地进行非球形数据的聚类,但是,该算法需要输入截断距离,人工截取聚类中心,这就导致DPC算法的聚类效果有时较差。针对这些问题,本文提出一种结合密度比和系统演化的密度峰值聚类算法(DS-DPC)。首先,利用自然最近邻搜索得出各样本点的邻居数目,根据密度比思想改进密度计算公式,使其能够反映周围样本的分布情况;其次,对局部密度与相对距离的乘积进行降序排列,根据排序值选出聚类中心,将剩余样本按照DPC算法的分配策略进行聚类,避免了手动选择聚类中心的主观性;最后,利用系统演化方法判断聚类结果是否需要合并或分离。通过在多个数据集上进行实验,并与其他聚类算法进行比较,实验结果表明,本文算法具有较好的聚类效果。
- 单位