摘要

字符识别是当今时代一个重要的应用领域,不仅可以提高对大数据集进行整理分类的效率,还可以进行异常字符识别。核零空间算法在处理高维数据,提取数据的非线性特征上表现出很大的优势。因此将核零空间算法用于UCI数据集中的字符识别数据集,并且利用Matlab进行仿真实验,仿真结果表明,将核零空间算法用于字符识别,可以有效检测数据集中的异常字符。之后,为了进一步突出核零空间算法的优势,故将one-class svm,svdd以及孤立森林等一分类算法也用于该数据集,之后分别计算了各个算法的F1-score,并与核零空间算法进行了对比,可以发现核零空间算法在异常字符的检测上比其他任何一种一分类算法的性能都好。