摘要

在垃圾短信用户的识别问题中,参与建模的用户行为消费数据存在极强的相关性,直接使用朴素贝叶斯算法建模准确率极低.为满足朴素贝叶斯算法要求建模属性条件独立的基本假定,利用主成分分析对数据进行处理,从而达到降维和属性独立的双重目的,继而利用朴素贝叶斯算法进行建模.结果表明,基于主成分分析和朴素贝叶斯算法的组合模型效果显著.可见在垃圾短信算法的识别中具有一定的实用价值和现实意义.

  • 单位
    许昌学院