摘要

密度峰值聚类算法作为一种基于密度的聚类算法,能够快速寻找出聚类中心完成聚类.但是该算法的局部密度定义较为简单,没有考虑到数据间的空间特性;其次,单一的分配策略易导致连续性分配错误.为解决该问题,提出一种共享K近邻和多分配策略的密度峰值聚类算法.该算法基于K近邻原理,引入了共享K近邻和放大因子重新定义了局部密度的度量方式,使得局部密度更加贴合数据间的分布特性且聚类中心点与非聚类中心点在决策值图中的差异性更大;优化了非聚类中心点的二次分配策略,避免分配非聚类中心点时产生连带错误.在12个数据集的测试表明,该算法的AMI、ARI、FMI值优于其他算法,能够有效提高聚类精度,并能够很好的捕捉聚类的准确性.