摘要

针对密度峰值聚类算法中,样本局部密度截断距离需主观选择和样本分配策略的误差扩散问题,提出自适应截断距离和构造流形距离优化样本分配的改进型密度峰值聚类算法。该算法首先使用样本K近邻自适应的选取各点的截断距离,即在样本密度大的点,选用大截断距离,准确选取类簇中心,在样本密度小的点,选用小截断距离,判别离群点。其次对于剩余样本通过样本的连接路径构造流形距离,优化样本分配策略。最后选取人工数据集进行聚类分析算法实验,与传统的密度峰值聚类算法进行实验对比,验证所提改进算法对聚类中心选取和样本分配的准确性。