摘要

不平衡数据分类是机器学习领域的研究热点及难点问题之一。传统分类算法难以融合少数类分类信息,在处理不平衡数据时分类精度不高。文中提出一种基于证据理论的不平衡数据分类方法CET。CET以决策树方法作为基分类器首先提取一级规则;通过融合少数类与相似样本,改善数据类分布平衡,建立多组小训练集后提取二级分类规则;利用证据理论融合两级分类规则信息,选最大可信度类别进行分类。实验证明,CET提高了少数类分类精度以及数据集整体分类准确率。