离散属性的朴素贝叶斯分类算法的优化

作者:李福祥*; 王建敏; 梁建创; 王雪
来源:小型微型计算机系统, 2022, 43(05): 897-901.
DOI:10.20009/j.cnki.21-1106/TP.2020-1041

摘要

朴素贝叶斯算法是一种经典的分类算法,广泛应用于很多领域.朴素贝叶斯分类算法引入了属性条件独立性假设,但这个假设在现实应用中往往不能满足,从而就会影响算法的分类性能.针对这一问题,本文对该算法进行了改进,对离散属性进行数值标记,之后用正交矩阵对连续属性和数值标记后的离散属性做正交变换,增强属性之间的相互独立性,去除了属性之间的线性关系,贴近了朴素贝叶斯分类算法的属性条件独立性假设,从而提高了分类准确率.最后基于改进的算法进行实验分析,实验结果表明,与标准朴素贝叶斯分类算法、贝叶斯网相比,改进的算法的分类性能有较大的提高.