摘要

数据关联是两个或两个以上取值之间存在的规律,反映了数据集各元素之间的有趣联系。关联规则挖掘作为数据挖掘的主要分支,主要是为了发现给定数据集中各元素间的相关信息。最近十几年,关联规则挖掘已取得了一定的发展,产生了许多关联规则挖掘算法。本文结合大数据环境的背景,基于经典频繁集算法的简介,着重分析了基于Apriori的算法优化和多层关联规则挖掘算法,最后阐述了几种经典算法的实现方式,从而提高关联规则挖掘的质量和效率。

全文