摘要
在大量的现实数据中,属性之间往往存在高度相关性,而朴素贝叶斯分类方法假定属性之间相互独立,如果不进行预处理直接将全变量参与到贝叶斯分类模型中,有时会导致其分类性能不佳。针对该问题,文中提出加权p-范数t核降维方法,并基于核矩阵特征值给出权系数计算公式;对于核函数中的参数,采用包裹式学习算法以及交叉验证确定相对最优值,最后构建了加权p-范数朴素贝叶斯分类算法。实证分析表明,相比于全变量模型、主成分分析以及单核主成分分析,利用文中提出的方法对4个医学数据集进行降维,在得到的数据集上进行朴素贝叶斯分类,可以显著提高其精度。
-
单位黔南民族师范学院; 长春工业大学