摘要

近年来涌现出很多数据流的应用 ,比如网络日志、传感器网络等 数据流的数据量无限、数据分布变化等特性使得传统的挖掘算法不能很好地解决这些问题 针对上述问题提出了一种数据流上的基于频繁模式的分类算法———CAPE(classificationusingfrequentpattern) CAPE通过数据流中的频繁模式进行分类 ,在压缩数据的同时保存了数据中的分类信息 实验证明 ,这种算法比其他算法有更高的准确性 并且CAPE可以很好地处理训练集包含大量缺失取值的应用