一种基于加权Jaccard距离的决策树集成选择方法

作者:于凯; 王立宏*
来源:烟台大学学报(自然科学与工程版), 2020, 33(02): 204-211.
DOI:10.13951/j.cnki.37-1213/n.2020.02.012

摘要

在决策树集成中,准确性和多样性都很重要,精确且多样化的决策树构成的集成系统能够提高对未知样本的分类精度.提出了一种加权Jaccard距离WJD来度量决策树的多样性,对WJD的性质进行了分析,并用基于WJD的层次聚类算法来选择集成.在UCI数据集上的对比实验表明,WJD是一种有效的多样性度量方法,基于WJD的决策树集成选择能够达到较高的预测精度.