摘要

带约束的关联规则挖据算法(ACARMT)在生成频繁项集时反复比较事务标识符,耗时较多。为进一步提高挖掘的效率,文章提出了一种项约束频繁项集挖掘算法(CFMABTB)。该算法首先根据约束条件C过滤原始数据库,再为每一个项目建立事务二进制,然后通过反复与运算计算各项目集的计数,进而挖掘出k项频繁集。最后在mushroom、chess数据集上,对CFMABTB、ACARMT算法进行了实验对比。结果表明,在数据规模和项目数量不是非常大时,CFMABTB算法的时间性能远优于ACARMT算法。

  • 单位
    南京信息职业技术学院