摘要
针对I-k-means-+算法聚类结果不稳定、求解精度较低的问题,提出一种基于min-max准则与区域划分的I-k-means-+聚类算法.首先,提出min-max准则,计算每个数据点到最近中心的距离,优先选择距离最大的数据点作为新的聚类中心,避免多个初始中心聚集在同一个簇中的情况;其次,将分裂簇中的数据点分割到不同区域,在每个区域中选取一个数据点作为候选中心,以增加候选中心的多样性;最后,对于配对失败的簇,通过增益重新选择新的分裂簇与原删除簇再次配对,以提高配对成功率,进一步降低目标函数值.实验结果表明,与I-k-means-+算法相比,本文算法在运行效率基本相当的前提下,求解精度平均提高6.47%,且聚类结果更稳定;与k-means、k-means++算法相比,本文算法的求解精度更高.
- 单位