摘要

决策树是从一组数据中生成分类器的一个行之有效的方法。其中ID3算法是目前引用率较高的算法。ID3算法是以信息熵为核心的分类预测算法。然而ID3算法存在多值偏向问题,可能使得出的决策树并不是最优的。文章将信息增益与关联函数生活经验和相结合,改进ID3算法,克服ID3算法偏向于选择取值多的属性的缺点,提高ID3算法准确率。并将改进后的ID3算法与原算法比较,证明改进后的ID3算法准确有效。