摘要

关联规则挖掘是最常用的数据挖掘方法之一,通常采用基于频繁项集的挖掘技术来进行。在得到频繁项集之后,如何快速产生关联规则也是影响关联规则挖掘耗时的一个重要因素。首先介绍了在事务数据集上基于Apriori算法的频繁项集挖掘算法实现方法,然后说明了由频繁项集生成关联规则的基本过程,分析了基于剪枝的关联规则生成算法对效率提升的原理。然后,提出了一种非递归的、基于剪枝的由频繁项集生成关联规则的方法。在同样的软硬件环境下,经过在多个阶的频繁项集上进行对比实验,新方法能正确完成关联规则生成,并且执行的时间耗费相比原来的方法大约平均减少了6%左右。