摘要

传统朴素贝叶斯算法基于独立分类方式,难以满足实际应用需求,针对这个问题,基于Hadoop分布式系统数据管理平台,提出了一种基于加权分析法的朴素贝叶斯改良算法。通过引入加权分析法对属性值进行加权处理,采用相关系数法和相关概率法来保证权重系数选择的合理性,有效提高分类精确度。实例结果表明:改良的加权朴素分析法在进行大规模数据测量中,具备很高的分类准确率和较快的分类速度,但在测试小数据样本时不能很好的体现优势,因此,该算法在大数据分析中具备了很高的数据挖掘分类优势。

  • 单位
    广东电网有限责任公司