摘要

样本的不均衡性直接影响分类器的精度,基于C4.5算法提出一种改进算法——PC4.5,并应用于MIT数据集.实验表明该算法能很好地处理训练集的不均衡性,并降低决策树的规模.

  • 单位
    计算机软件新技术国家重点实验室; 南京大学