基于云计算的大数据挖掘是业界研究的热点,Apriori算法是数据挖掘中一种流行的经典算法。该文基于Hadoop的关联规则,在各种数据集中找到有用的模式,讨论了新提出的改进先验算法的模型,新算法减少了候选项集的剪枝操作。实验结果表明,新算法减少了存储空间,提高了算法的效率和准确性,减少冗余关联规则,在处理海量数据方面具有高效优势。