一种基于聚类结果稳定性来确定聚类数的方法

作者:丁小军; 陈杰; 李霖; 徐碧通; 朱晓姝
来源:玉林师范学院学报, 2020, 41(03): 43-47.
DOI:10.13792/j.cnki.cn45-1300/z.2020.03.007

摘要

为了在不了解原始数据内部结构的情况下,确定合适的聚类数,本文提出了一种聚类结果稳定性的衡量方式,结合传统的手肘法来确定聚类数。实验采用了UCI上3个标准的机器学习聚类数据集,在wine数据集上,该方法和手肘法均能找到正确的分类数。在iris和digits数据集上,手肘法未能确定聚类数,本文方法给出了几个可能的聚类数(包含最优聚类数)。