摘要

针对依靠单一算法训练互联网用户行为数据构建的贝叶斯网络(Bayesian Network, BN)计算耗时长、结构不稳定等问题,提出加权概率融合并行贝叶斯网络增量学习(WPFPBayes)算法。该算法根据自适应数据切片算法找出最优数据片尺寸,快速进行并行BN模型训练;将数据切片上学习得到的若干子BN结构通过融合加权概率方法合并成一个全局BN模型;通过一种增量评分函数定量表示单位时间内网络模型与数据之间适应程度的变化情况;采用依据特定结点进行BN更新的措施达到新旧数据在网络中的平衡。仿真实验结果表明:WPFPBayes算法下得出的BN模型的效率及其准确率均高于其他常见算法;随着数据量的增加,BN模型数据表达的准确率和稳定性均得到提高,可以更有效检测网络用户的异常行为。