摘要

针对在不确定数据流上的频繁模式挖掘问题,设计了用于存储项可靠度的期望支持数加权(Weighted with Expected Support,WES)矩阵和只存储有事务分组信息和项支持数的分组支持数树(Expected Support tree with Batches Information, ESBI-tree),提出了一种基于不确定数据流的期望频繁模式挖掘(Expected Frequent Pattern Mining over Uncertain data Stream,EFPMUS)算法。在试验中,将EFPMUS算法与SUF-growth(Frequent items growth from Streams of Uncertain data)、DSUF-mine(algorithm to mine Frequent pattern based on probability Decay of Sliding window over Uncertain data Stream)、BSUF-mine(efficient algorithm for mine Frequent pattern Based on Sliding window over Uncertain data streams)算法在运行时间、占用内存、模式数量和可扩展性上的性能进行了比较和分析,表明该算法可高效地从不确定数据流中挖掘出期望频繁模式。

  • 单位
    北京市遥感信息研究所