摘要

为了解决传统决策树算法偏向于多值特征的不足,提出了一种基于信息散布指数的改进决策树算法.引入信息散布指数作为评价准则惩罚因子,该指数能够反映出特征的多值程度,从而降低了评价准则对多值特征的依赖性.同时,结合信息增益,面向二元、分类和序数等离散类型数据实现了决策树的构造.通过实验结果表明:提出改进算法能够减少对多值特征的偏倚,与其他几种算法相比具有更低的分类错误率和更优的分类性能.

  • 单位
    商丘职业技术学院