摘要

为解决ID3算法在构建决策树时偏向于选择取值较多的属性为分支节点的问题,提出一种控制属性偏向程度的数据分类方法。该分类方法通过修正的信息增益和属性偏向阙确定均衡系数,利用均衡系数对ID3算法得到的信息增益进行优化,根据优化信息增益得到决策树的根节点、分支节点,对属性进行分类,构建决策树。通过实例证明该分类方法可以实现对多值偏向的控制,避免选择取值较多的属性为分支节点,提高预测的准确率和算法的效率。