摘要
针对传统数据流频繁项集挖掘算法在支持度更新、窗口更新方式、频繁k-项集挖掘等方面存在的一系列问题,造成空间和时间效率不高,改进研究了一种高效挖掘数据流频繁项集的AO算法。采用滑动窗口思想,对数据流分块挖掘;在满窗口有新数据流入时,采用取余插入完成数据更新;挖掘频繁k-项集采用And Operation求解支持度,并在挖掘过程结合超集检测,极大地提高了挖掘效率。实验结果表明,该算法在时间和空间效率上均有一定的优越性。
-
单位通信与信息工程学院; 重庆邮电大学