摘要

描述关联规则Apriori算法的基本原理,并指出它在大数据环境下的不足,进而根据大数据的特点从Apriori算法的缺陷出发提出相应的解决思路,重点介绍基于"位"逻辑运算的改进Apriori算法。相对于Apriori算法,改进后的算法只需遍历一次数据库,便可以得出1-项集中各成员的位串,各成员位串用计算机能快速识别的二进制代码0和1来表示,在很大程度上提高了运算效率。