摘要

现有的很多聚类算法在各种数据集中检测任意簇时通常不能获得好的性能。通过把每个数据点看作自然界中的质点,定义了数据点间密度引力的概念,在此基础上提出了一种新的具有鲁棒性的密度引力聚类算法。首先根据每个数据点的周围邻居分布稀疏程度获得其局部密度,然后迭代地将每个数据点分配给密度比它大且距其最近的互近邻点形成初始簇,最后将具有共同数据点的初始簇进行合并得到最终簇。实验将提出的新算法在六个不同维度、不同类型的数据集上分别与三种经典算法、三种新算法进行了测试,结果表明该算法的聚类性能优于对比算法,且可以在不同维度的数据集中发现任意簇。