摘要
针对Hadoop框架下的用户行为大数据挖掘效率问题,提出了一种改进的关联规则Apriori挖掘算法。该算法首先实现了Hadoop框架下的项集分类建模。然后通过传统关联规则Apriori算法的挖掘步骤分析,对候选项目集的生成方式进行了改进,并结合标志位信息实现无用事务去除,有效压缩了事务和项目的数量,从而缩短了任务处理时间。在具体实现过程中对改进Apriori算法流程进行了Map Reduce处理。仿真实验表明:相比于传统Apriori算法,改进后的Apriori挖掘算法具有更高的执行效率。
-
单位中国社会科学院; 广西大学行健文理学院