摘要

为了降低稀疏主成分分析(Sparse Principal Component Analysis, SPCA)算法对高维数据集的计算复杂度,提出一种改进SPCA(Improved Sparse Principal Component Analysis, ISPCA)算法。该算法将特征选择过程分为两个阶段,第一阶段利用不带低秩惩罚项的SPCA先对数据进行一次特征选择,得到降维数据,采用矩阵的广义逆引理降低算法复杂度。第二阶段在降维数据上执行带低秩惩罚项的SPCA对降维数据再次进行特征选择。对比实验结果表明,ISPCA算法比SPCA算法受参数影响较小,特征选择性能更优,运行速度更快。