摘要

Apriori算法是一种经典的关联规则挖掘算法,算法能够很好地挖掘出关联规则,通过对频繁项集的连接步和剪枝步得到候选集,但是还要对大量候选集进行多次重复扫描数据库,产生庞大的候选集,严重影响了算法执行效率。论文提出一种基于矩阵的改进算法,通过事务矩阵和项集矩阵相乘来改进反复回扫数据库的问题,建立事务数组统计删除在算法执行过程中不能生成下一频繁集的事务,优化Apriori算法对频繁项集的连接步和剪枝步过程。通过实验验证改进算法不仅能准确地挖掘出频繁项集而且大大地缩短挖掘时间。