摘要

现有的密度峰值聚类算法存在时间复杂度过高和空间复杂度过高的问题,基于此,论文提出。通过网络划分的方法,将各个数据点映射到相应的网格来解决这个问题,并且在计算网格密度时为了解决网格划分对密度分布的割裂引入了邻域网格密度贡献的概念,克服了传统网格划分所产生的不平滑现象。此方法降低了聚类计算时的时间复杂度和空间复杂度,使得算法适用与大规模数据聚类。通过在数据集上进行实验显示该算法在保证准确性的前提下能有效减少时间和空间复杂度。