摘要
Apriori算法是一种基于挖掘布尔关联规则频繁项集的算法,很多挖掘算法都是在Apriori算法的基础上加以改进的。然而,该算法产生K-项频繁项集时需要对大型事务数据库扫描K次,多次扫描大型数据库将直接影响到算法的执行效率。本文通过对数据挖掘主要任务的研究,结合数据挖掘过程的需求和Apriori算法存在的问题,阐述了对Apriori算法的改进意见。表明改进的Apriori算法可以减少K-项集中CK的数量,进而提高数据库扫描效率。同时也说明了数据挖掘技术对计算机技术发展的推动作用。
-
单位西安外事学院; 现代教育技术中心