基于邻域样本稳定性的三支聚类方法

作者:李洪梅; 姜冬勤; 王平心*
来源:山西大学学报(自然科学版), 2020, 43(04): 874-879.
DOI:10.13451/j.sxu.ns.2020075

摘要

文章将样本稳定性和三支聚类结合,给出了一种基于邻域样本稳定性的三支聚类算法。首先使用任意两个样本的邻域中的公共元素个数定义两个样本的共现概率,并在此基础上定义每个样本的稳定性,然后基于阈值将这些样本元素分为稳定样本集和不稳定样本集。对稳定集中的样本,采用传统方法挖掘其类簇结构。对于不稳定集中的样本,通过比较样本到稳定集中聚类中心的距离将它们分到相应类的边界域中。通过以上策略可以得到三支聚类的核心域和边界域。在UCI数据集上的实验结果显示,该方法能够更好地显示出聚类的结构。