摘要
聚类作为机器学习中一种重要的无监督学习方式,在图像处理及生物基因分类上具有广泛的应用。快速密度峰搜索与聚类算法(DPC)提出通过寻找密度峰对数据进行分类,它既不需要迭代过程,也不需要人工输入太多参数。但在球形数据集上,DPC算法聚类效果不好,容易忽略潜在的聚类中心,需要人工参与聚类中心选取。针对上述问题,本文采用模糊邻域关系计算数据密度,采用比较距离代替DPC算法中的相对距离。通过对机器学习数据集的实验,将本文提出的算法同DBSCN、OPTICS、DPC在准确率和调整兰德系数上进行比较。实验结果表明本文提出的算法可行有效。
- 单位