摘要
主成分分析(PCA)是一种无监督降维方法。然而现有的方法没有考虑样本的差异性,且不能联合地提取样本的重要信息,从而影响了方法的性能。针对以上问题,提出自步稀疏最优均值主成分分析方法。模型以L2,1范数定义损失函数,同时用L2,1范数约束投影矩阵作为正则化项,且将均值作为在迭代中优化的变量,这样可一致地选择重要特征,提高方法对异常值的鲁棒性;考虑到训练样本的差异性,利用自步学习机制实现训练样本由"简单"到"复杂"的学习过程,有效地降低异常值的影响。理论分析和实验结果表明,以上方法能更有效地降低异常值对分类精度的影响,提高分类精度。
- 单位