摘要
针对密度峰值聚类算法在截断距离选取存在主观性依赖和非簇中心点的分配策略易出错的问题,提出一种结合模拟退火和多分配策略的密度峰值聚类算法(SA-DPC)。首先,利用模拟退火的启发式搜索找到全局最优的截断距离,设计以标准互信息(NMI)为目标函数的参数寻优模型;然后,从簇中心点开始以广度优先搜索的方式进行密度拓展;最后,找出雏形簇最近邻点依次分配。8个人工合成数据集的实验结果表明,改进的算法降低了聚类效果对截断距离的敏感性,且改进算法的ACC、ARI和AMI与原算法相比,分别最高提升了约35%、90%、80%。
- 单位