摘要

针对具有复杂结构的高维数据分类问题,文章提出一种基于特征选择和约简的加权朴素贝叶斯算法(WNBC-FSR)。该算法基于距离相关和最大信息系数的方法,从相关性和冗余性两个角度对高维数据进行特征筛选;采用属性和类别变量间的最大信息系数对属性进行加权,构建并训练加权朴素贝叶斯算法。实验结果表明:在几种算法的比较中,无论是从AUC还是F1值来看,WNBC-FSR算法的分类效果均是最优的。

  • 单位
    山西财经大学