摘要

在监督分类中数据的不平衡性是导致各种分类算法效果不佳的主要原因之一,尤其在一些实际问题中,少数类被错分的代价极高,此时我们更关注对少数类的分类精度,为提升二分类不平衡问题中的少数类样本的分类精度,提出了不平衡数据最优比例重抽样与投影寻踪分类树算法相结合的分类方法。一方面基于重抽样技术和贝叶斯决策理论,通过最小化错分代价,得到不平衡数据集的最优重抽样比例,另一方面,利用投影寻踪分类树具有树结构简单,解释性强且分类精度高的优势,选择该算法作为基分类器进行训练。六组数据集进行实证研究,结果表明,本方法在不平衡数据上有良好的分类效果,为不平衡数据分类研究提供了理论参考。