摘要

针对有噪条件下新类检测性能较差的问题,提出一种基于核零空间判别局部保持投影算法(KNDLPP).首先通过核函数将样本隐式映射到高维特征空间,在核空间中利用距离加权机制对样本进行权重赋值,在保持局部结构的同时降低离群噪声样本的影响;然后利用样本类内零空间使同类样本坍塌为一点,实现对已知类分布的有效约简;最后基于零空间再求得使类间距最大化的变换矩阵,以上步骤得到一个判别性变换矩阵以刻画样本的分布信息、描述样本之间的相似性.该算法能刻画样本潜在结构,提升已知类与新未知类之间的判别性.在11个公开数据集上的实验结果表明,该算法是有效和鲁棒的,具有较好的新类检测性能.在局部保持性实验中, KNDLPP在4个UCI数据集上的整体平均AUC值为90.656%;在复杂结构保持性实验中, KNDLPP在Banana, Moon及3个UCI数据集上的整体平均AUC值为91.949%;在2个无噪高维数据集的新类检测实验中, KNDLPP平均AUC值为86.214%,高于次优算法4个百分点;在4个UCI数据集的4种有噪条件下, KNDLPP性能排名第1.