融合变异萤火虫算法的三支聚类方法

作者:李兆彬; 叶军*; 周浩岩; 汪一心; 韩宇贞
来源:系统仿真学报, 2024, 1-11.
DOI:10.16182/j.issn1004731x.joss.23-1300

摘要

三支聚类相比较二支聚类而言增加了边界域,使之增加了处理不确定性数据的能力,避免了样本被强制划分带来的决策错误。但该算法也存在不足,一是随机选取初始聚类中心会导致算法出现早熟和聚类结果不一致的现象;二是q近邻概念中q的取值需要通过不断重复实验得到以及以q值决定边界域样本的数量,有时会导致边界域样本数量失衡问题。为此,提出一种变异萤火虫优化的三支聚类算法来解决初始中心点敏感的问题,以目标函数值作为萤火虫光亮强度进行聚类中心点的搜索,将求得的最优解作为算法的聚类中心进行迭代;同时提出边界域归属度公式以及自适应阈值,使得边界域中样本满足阈值条件情况下尽可能地划分到核心域当中,避免了边界域样本过多的问题。最后通过UCI数据集实验结果表明,改进后的算法大幅降低了迭代次数,提高了聚类结果准确率,也验证了该算法的稳定性和有效性。

全文