摘要
主成分分析(Principal component analysis, PCA)是处理高维数据的重要方法.近年来,基于各种范数的PCA模型得到广泛研究,用以提高PCA对噪声的鲁棒性.但是这些算法一方面没有考虑重建误差和投影数据描述方差之间的关系;另一方面也缺少确定样本点可靠性(不确定性)的度量机制.针对这些问题,本文提出一种新的鲁棒PCA模型.首先采用L2,p模来度量重建误差和投影数据的描述方差.基于重建误差和描述方差之间的关系建立自适应概率误差极小化模型,据此计算主成分对于数据描述的不确定性,进而提出了鲁棒自适应概率加权PCA模型(RPCA-PW).此外,本文还设计了对应的求解优化方案.对人工数据集、UCI数据集和人脸数据库的实验结果表明, RPCA-PW在整体上优于其他PCA算法.
- 单位