摘要
增量关联挖掘领域是近几年数据挖掘研究的一个热点,而CAN-tree的提出是增量关联挖掘发展的一个重要里程碑.虽然CAN-tree适用于增量关联挖掘,但CAN-tree构建时间长,挖掘效率偏低;针对此问题,提出了一种基于CAN-tree快速构建算法,该算法增加基于哈希表的辅助存储结构,用于减少项目的查找时间,从而提高CANtree的构建速度;增加叶子地址表并修改节点结构及改child指针为parent指针,目的是减少剪枝时间和条件模式基的生成时间,从而提高数据挖掘效率.实验结果表明该算法有效.
- 单位