稀疏约束的嵌入式模糊均值聚类算法

作者:王继奎; 杨正国; 易纪海; 刘学文; 王会勇; 聂飞平*
来源:复旦学报(自然科学版), 2020, 59(06): 725-733.
DOI:10.15943/j.cnki.fdxb-jns.2020.06.009

摘要

降维作为聚类问题的关键预处理步骤被用来抽取高维数据潜在的低维子空间结构.面对高维数据聚类,传统的策略是首先采用降维技术提取高维数据嵌入在低维空间的潜在数据结构,然后利用一个聚类算法完成数据聚类.然而,这种两阶段优化策略的聚类性能往往不如直接优化统一的目标函数.因此,在模糊聚类算法的基础上,本文提出了一种稀疏约束的嵌入式模糊均值聚类算法(EFSC),该方法结合线性正交投影技术在对高维数据降维的同时完成聚类.EFSC模型对模糊矩阵施加了稀疏约束来提升聚类性能.理论分析与实验结果证明了本文提出的EFSC算法的有效性.