摘要

机器学习中的决策树算法在处理没有属性缺失的数据集各样本时比较容易,但数据集较大时,往往某些属性会出现缺失值,这时就不能再使用通用方法来分析。利用决策树算法,以长白山植被识别为实例,通过对缺失值数据进行特殊处理,引入权重后重新计算每个属性的信息增益,再构建最优决策树,从而实现缺失值情况下对长白山植被的识别,能对新样本进行有效预测。

  • 单位
    长春工程学院