摘要
为减少原始Apriori算法在频繁项集与候选项集上扫描整个数据库时间和空间造成大量消耗,采用基于频繁项目集挖掘算法(FIM)来减少项目集,通过减少对候选项集与频繁项集的控制与规则树的剪枝,并在其基础上优化并行算法和针对特定集群分区的方法,使用温室蔬菜生长环境数据与产量数据进行试验。试验结果表明:改进算法在平均时间复杂度方面优于原始算法,改进算法的平均运行时间仅为原算法62.5%,新算法适合大规模数据挖掘,特别是候选项与处理事务的数量较大的情况,在不同的最小支持度的条件下,改进后的Apriori降低时间率的平均值为72.40%。
- 单位