摘要

为提高随机森林算法的分类精度,在分析影响随机森林算法分类精度的几个要素后,针对随机森林中决策树的多样性,提出基于计算节点匹配代价的方法对随机森林算法进行优化。通过对比随机森林中所有决策树的分支点和分支点属性,利用匈牙利算法计算出两个决策树节点间最高匹配代价,建立决策树间的相似度矩阵。在相似度矩阵的基础上,通过谱聚类算法对决策树进行聚类分析,保留每类决策树中Kappa系数最高的决策树构建新的随机森林,依据其自身的Kappa系数对判决结果进行加权处理。实验结果表明,聚类加权优化后的随机森林算法的分类精度优于传统的随机森林算法。