随着大数据时代的到来,作为关联规则挖掘的经典算法,Apriori算法受到了广泛的关注和研究,论文在总结现有研究的基础上提出了一种基于链表的改进Apriori算法。该算法首先扫描事务数据库计算频繁-1项集并采用链表进行压缩存储,避免了重复扫描事务数据库带来的额外开销,然后在频繁-N项集(N≥1)的基础上利用高效的位运算对链表进行合并操作生成频繁N+1项集,对频繁N+1项集(N≥1)的产生过程进行了优化,提高了Apriori算法的效率。