摘要

邻近传播(Affinity Propagation,AP)聚类将数据集中所有数据点均视为潜在的聚类中心,并采用欧氏距离法计算输入相似度矩阵,导致其性能对变形十分敏感。针对这一缺陷,提出了采用两种不同的相似性度量方法来计算数据集中两个数据点之间的相似度。分别将明可夫斯基(Minkowski)和切比雪夫(Chebychev)相似性度量引入到AP聚类中,替换原有的欧氏距离度量来构建相似性矩阵。在UCI机器学习数据集上,利用Jaccard指数和Fowlkes-Mlowers对提出方法进行了量化评估。实验结果表明,基于明可夫斯基距离和切比雪夫距离的AP聚类方法在总体精度上优于现有的欧氏距离。

  • 单位
    成都理工大学工程技术学院