摘要
Apriori等算法是数据挖掘中挖掘关联规则的著名算法。Apriori算法的主要思想为:通过限制候选产生发现频繁项集,由频繁项集产生关联规则。为了提高逐层产生频繁项集的效率,Apriori算法先对搜索空间进行压缩,利用了一条重要性质,即先验性质"频繁项集的所有非空子集也一定是频繁的"。之后已经提出了许多Apriori算法的变形,旨在提高原算法的效率。本文提出了借助分类和编码思想,提出基于编码的关联规则挖掘算法,得到类与类之间的关联规则以及类中项之间的关联规则,这些信息同样是很有价值的。
- 单位