摘要

本文针对网络系统中含有概念漂移的分布式实时数据流分类问题,提出了一种分布式自适应Hoeffding树算法。基于分布式一致性策略,设计了一种网络通信交互机制,邻居节点之间只需交互一些统计量信息,单个节点即可对整个网络的全数据流进行概念漂移监控,且构造的本地模型能有效逼近于全网络数据流的数据分类模型。相比于现有的集中式Hoeffding树算法,有效地降低了收集网络全数据流于中心节点集中处理所需的通信成本,且能有效应对保密数据无法收集于同一节点的情况。最后,采用合成数据集仿真验证了算法的有效性和可行性。