Apriori算法的压缩二进制编码改进

作者:谷鹏; 肖建于*; 徐成振
来源:宜宾学院学报, 2020, 20(06): 54-58.
DOI:10.19504/j.cnki.issn1671-5365.20191209.001

摘要

针对Apriori算法在挖掘数据时因频繁的I/O操作而导致效率低下,提出了基于压缩二进制编码的Apriori改进算法.将事务、候选项集、频繁项集转成二进制编码表示,并增加一个统计事务二进制编码的重复项次数的变量,减少事务规模.利用二进制数比其它数据结构在编程语言速度更快的特点,从而提高算法效率.通过实验结果表明,改进的算法相比于Apriori算法,可以正确挖掘频繁项集,同时更有效率,运行时间最大提升达到61%.

全文