摘要

FP-Growth算法在挖掘过程中产生大量的条件FP树,构造和遍历这些树要花费较大的时间开销,且需占用大量的存储空间,导致算法挖掘效率不高。为此,提出了一种新的FP树裁剪方法,构造二维数组存放所有2-项集的支持度计数,利用"若某一项集的子集是非频繁的,那么该项集一定不是频繁项集"这一性质判断包含某结点的项集是否是频繁项集的,继而实现对FP树的裁剪。实验结果表明,改进后的算法可有效减少FP树的结点数,同时减少条件FP树的生成,从而提高了挖掘效率。

  • 单位
    宁德师范学院