摘要

本发明提供了一种考虑集成误差和集成多样性的分类方法和装置,首先获取包括M个历史样本数据x-l的特征向量X-l和对应的分类标签Y-l的训练集,再采用集成学习算法得到多分类器系统c={c-1,…,c-U},然后计算训练集中各个样本x-l的与待分类样本之间的平均相似性AS-l;再基于AS-l的值选出与最相似的K个历史样本,组成近邻区域再基于多分类器系统c中各个基分类器在近邻区域上的预测表现,优化求出一组最优权重;最后根据最优权重确定待分类样本的最终分类结果。不仅考虑了一组分类器的集成性能以及不同分类器之间的多样性,而且还能够根据每个待分类样本的特点产生一组最优权重,用于加权合成不同分类器的预测结果,以保证最终分类的精度和稳定性。