一种连通合并优化的k近邻密度峰值聚类改进算法

作者:廖丽敏; 荣章权; 王洋
来源:数字技术与应用, 2021, 39(02): 118-122.
DOI:10.19695/j.cnki.cn12-1369.2021.02.38

摘要

针对经典的密度峰值聚类不适用于复杂分布的数据集,且聚类中心需要人为选择的问题。本文提出一种连通合并优化的k近邻密度峰值聚类改进算法,采用数据本身的统计量作为衡量数据连通的标准,利用数据连通概念进行聚类过程。本算法首先计算每个点的特征参数,再计算连通阈值,最后根据中心影响力选取聚类中心,将与其连通的数据点全部归入一类。在不引入新的人为参数的前提下,实现了自动选取聚类中心的功能,且明显改善了密度峰值聚类在复杂数据分布情况下的性能,经过测试新算法在复杂分布的数据集上具有更高的准确率。

  • 单位
    广东顺德工业设计研究院(广东顺德创新设计研究院)

全文