基于MapReduce的Apriori前后项约束关联规则改进算法

作者:王伟*; 储泽楠; 韩毅; 吴朝霞; 焦清局
来源:信阳师范学院学报(自然科学版), 2020, 33(03): 448-453.
DOI:10.3969/j.issn.1003-0972.2020.03.019

摘要

针对经典的Apriori算法依赖内存,只适用于小规模数据集,在面对海量数据集时显得无能为力以及该算法没有考虑用户的需求情况等问题,提出了基于MapReduce的Apriori前后项约束关联规则改进算法。该方法首先对经典Apriori算法挖掘过程进行了改进,加入了用户的前后项约束规则,使得在挖掘过程中剪枝的程度更大并且获取到更加精准的规则。然后利用云计算的MapReduce编程技术,对改进的Apriori算法的各个步骤并行化。实验结果表明,改进的算法在处理不同的数据集时有一定的优势,然后经过MapReduce模型并行化后,提高了对海量数据的处理能力和效率,并且具有良好的扩展性。

全文