摘要

针对FP-growth算法中需要频繁建立条件模式(FP)树并递归挖掘的问题,提出了在单路径条件FP树情况下的一种基于组合思想而改进的FP-growth算法。通过组合单路径条件FP树中频繁一项集的方法,实现无需递归而达到挖掘频繁项集目的。并以某省地税局风险监控平台系统中的税务数据为基础,使用改进后的FP-growth算法,挖掘纳税人偷税漏税行为中频繁出现的税种税目之间的强关联规则,实验结果表明,改进后的FP-growth算法不仅提高了挖掘频繁项集的效率,而且为税务征管和稽查工作提供了更好的依据。