摘要

最大频繁项集的挖掘过程中,在最小支持度较小的情况下,超集检测是算法的主要耗时操作.提出了最大频繁项集挖掘算法 FPMFI(frequent pattern tree for maximal frequent item set)使用基于投影进行超集检测的机制,有效地缩减了超集检测的时间.另外,算法FPMFI通过删除FP子树(conditional frequent pattern tree)的冗余信息,有效地压缩了 FP 子树的规模,减少了遍历的开销.分析表明,算法 FPMFI 具有优越性.实验比较说明,在最小支持度较小时,算法 FPMFI 的性能优于同类算法 1 倍以上.