基于min-max准则与区域划分的I-k-means-+聚类算法

作者:曲福恒; 宋剑飞; 杨勇*; 胡雅婷; 潘曰涛
来源:吉林大学学报(理学版), 2023, 61(05): 1131-1138.
DOI:10.13413/j.cnki.jdxblxb.2022482

摘要

针对I-k-means-+算法聚类结果不稳定、求解精度较低的问题,提出一种基于min-max准则与区域划分的I-k-means-+聚类算法.首先,提出min-max准则,计算每个数据点到最近中心的距离,优先选择距离最大的数据点作为新的聚类中心,避免多个初始中心聚集在同一个簇中的情况;其次,将分裂簇中的数据点分割到不同区域,在每个区域中选取一个数据点作为候选中心,以增加候选中心的多样性;最后,对于配对失败的簇,通过增益重新选择新的分裂簇与原删除簇再次配对,以提高配对成功率,进一步降低目标函数值.实验结果表明,与I-k-means-+算法相比,本文算法在运行效率基本相当的前提下,求解精度平均提高6.47%,且聚类结果更稳定;与k-means、k-means++算法相比,本文算法的求解精度更高.

全文