摘要

不平衡数据的集成学习分类,存在数据子集划分难以覆盖整体数据分布、基分类器权重设置主观性强等问题,鉴于此,提出不平衡数据分类的矩阵粒加权集成分类算法。首先,采用bagging粒化算法划分数据集,形成若干矩阵粒数据子集;然后,应用矩阵距离算法,计算矩阵粒与全一矩阵之间的距离作为集成规则权重;以各矩阵粒为单位构建CART基分类器分别训练;最后,采用矩阵粒距离权重集成规则实现集成分类,以KEEL数据库中不平衡数据集为实验数据,验证了算法的有效性。仿真结果表明,矩阵粒加权集成分类算法具有较高的分类准确性,是对不平衡数据分类算法研究的一次有益尝试和补充。