摘要

聚类算法是人工智能领域的重要组成部分,选择合适的聚类评价指标对于聚类结果的正确评估具有重要意义。选择常用的3个聚类内部评价指标在不同分布数据集下的不同算法聚类结果进行对比实验,基于极差比和变异系数对聚类评价指标的波动性进行对比。实验结果表明,Silhouette Coefficien (SC)指数值波动最小;Davies-Bouldin (DB)指数值波动最大。评价指标在各数据集中的聚类性能排名方面,SC指数和Calinski-Harabasz (CH)指数具有一致性。这3个指标在团状数据集上聚类效果最好;在同心圆数据集上聚类效果最差。通过对聚类评价指标在数据集上相关性的分析发现,每个聚类评价指标对不同数据集具有特定的倾向性。

  • 单位
    四川大学锦江学院

全文