摘要

聚类是将物理或抽象对象的集合分成由类似的对象组成的多个类(簇)的过程。同一个簇中的对象彼此相似,而不同簇中的对象差异较大。以基因表达式编程算法为基础,结合新设计的广义聚类代数算子和目标优化函数,提出一种基于基因表达式编程的多目标自动聚类算法(MAGEP-Cluster)。该算法不仅可以自动确定最优聚类的数目,还可以同时基于簇内数据紧凑性和簇间数据连通性两个指标实现数据的有效划分。在三个人工数据集和五个UCI数据集上的实验结果表明,与GEP-Cluster、MOCK和VAMOSA等算法相比,MAGEP-Cluster具备更好的聚类性能。