针对Apriori算法在挖掘数据时因频繁的I/O操作而导致效率低下,提出了基于压缩二进制编码的Apriori改进算法.将事务、候选项集、频繁项集转成二进制编码表示,并增加一个统计事务二进制编码的重复项次数的变量,减少事务规模.利用二进制数比其它数据结构在编程语言速度更快的特点,从而提高算法效率.通过实验结果表明,改进的算法相比于Apriori算法,可以正确挖掘频繁项集,同时更有效率,运行时间最大提升达到61%.