一种基于级联模型的类别不平衡数据分类方法

作者:刘胥影; 吴建鑫; 周志华
来源:南京大学学报(自然科学), 2006, (2): 148-155.
DOI:10.3321/j.issn:0469-5097.2006.02.005

摘要

真实世界问题中,不同类别的样本在数目上往往差别很大,而传统机器学习方法难以对小类样本进行正确分类,若小类的样本是足够重要的,就会带来较大的损失.因此,对类别分布不平衡数据的学习已成为机器学习目前面临的一个挑战.受计算机视觉中级联模型的启发,提出一种针对不平衡数据的分类方法BalanceCascade.该方法逐步缩小大类别使数据集趋于平衡,在此过程中训练得到的一系列分类器通过集成方式对预测样本进行

全文