摘要

将数论中的二维数据最优集结点 (广义Fermat点) 向高维空间拓展, 提出以高维广义Fermat点作为最优聚类中心点的划分聚类算法——k-Fermat聚类. 首先对Fermat点作为聚类中心点的最优性、唯一性进行理论分析, 其次建立了模拟植物生长算法 (PGSA) 求解高维数据的Fermat点并指导聚类的算法体系, 最后对算法复杂性进行了严格证明. 为验证算法性能, 采用国际公布的经典数据集, 将k-Fermat算法与近年来国际重要期刊和顶级会议发表的几十种主流聚类算法进行比较, 验证了本文算法的精确性和稳定性. 本文改进了目前划分聚类算法中没有最优聚类中心点的理论不足, 为非监督学习探索了一个新方法.