摘要
针对Apriori算法从数据中挖掘频繁项集的计算时间效率较低和空间内存占用较高的问题提出一种ATSAHT-Apriori(Adjacency Table Storage and Hash Table-Apriori)算法。该算法利用哈希表来存储数据,极大地提高了项集支持度频数的计算效率,结合图存储的思想利用邻接表来存储候选项集,极大地优化了内存空间占用,同时将候选项集构建大根堆,通过堆排序的思想与动态剪枝算法思想优化了频繁项集的计算速度和候选项集存储的内存空间,有效地优化了传统Apriori算法的计算时间效率和内存空间占用方面的不足。一系列对比实验表明,ATSAHT-Apriori算法在时间效率和空间效率都有一定的提高。
- 单位