基于最频繁项提取和候选集剪枝的THIMFUP算法

作者:杨勇; 张磊; 曲福恒; 刘俊杰; 陈强
来源:吉林大学学报(理学版), 2021, 59(03): 635-642.
DOI:10.13413/j.cnki.jdxblxb.2020277

摘要

针对FBCM(基于矩阵压缩FUP(fast update algorithm))算法在项集挖掘过程中存在频繁扫描原频繁项集库,并生成大量候选集的问题,提出一种通过提取数据库中最频繁项的方法,以降低对原频繁项集库的扫描次数;并通过候选集剪枝思想,减少算法整体运行过程中的候选集生成,以提高频繁项集的挖掘速度.实验结果表明,在相同实验条件下,该算法的效率比FBCM算法效率提高15%以上,最高达60%.

全文