摘要
为发现精准的关联规则,对多层关联规则问题进行研究,提出基于散列技术的HashCumulate多层关联规则算法。通过对原有Cumulate算法进行分析,对Cumulate算法有较多冗余候选集影响算法运行时间的缺点进行改进,提出在产生候选2项集时判断其中两项的关系进行删减,将候选2项集映射到散列表中进行筛选,减少候选集数量,进而减少扫描事务集的时间,提高算法运行效率。通过对原Cumulate算法与HashCumulate算法进行实验比较和实例分析,验证HashCumulate算法具有较高的运行效率。
- 单位