文本识别问题是模式分类中的一类重要的识别问题,也是较难处理的一类。该类问题中往往存在很多冗余属性,因此传统的分类方法对它的效果一般不好。本文针对文本识别问题,提出了一种基于核主成分分析的神经网络集成算法,该算法首先利用核主成分分析进行降维,合理的去除冗余属性,然后再利用神经网络集成算法进行分类学习。在文本分类数据集上的实验说明,本文算法可以有效地提高文本分类问题的分类性能。