摘要

粗糙K-means聚类算法存在如下不足:随机选取初始聚类中心会导致算法过早收敛容易陷入局部最优,质心更新公式中的权重和决定对象划分的阈值采用定值有时会导致聚类结果波动较大和精度下降。针对以上问题,引入一种变异策略和差分进化的萤火虫算法,从3个方面进行优化:构造新的目标函数,以目标函数值作为萤火虫光亮强度进行初始聚类中心点的搜索,把萤火虫算法求得的最优解作为算法的聚类中心进行聚类迭代;以下近似集和边界集中对象数量的变化以及对象分布的差异性动态调整质心权重;给出一种通过迭代次数自动获取阈值的方法。试验结果表明,改进后的算法减少了迭代次数,聚类结果稳定性好,准确率更高,改善了算法对随机初始中心点的敏感和稳定性不足等问题。