摘要

Web页面包含复杂的、无结构的、动态的数据信息,快速找到感兴趣的Web数据信息过程受到干扰。为了避免上述问题,提出了一种对改进的Apriori算法用于Web数据区域兴趣区的挖掘分析,对传统的算法进行改进,在自然连接产生候选集以前对Web数据进行一个修剪过程,减少参加连接的项集数量,因而减小生成的候选项集规模,减少了循环迭代次数和运行时间,同时在连接判断步骤中减少多余的判断次数,保证Web兴趣区域挖掘的高效性。实验证明,利用上面阐述的算法进行Web兴趣区域数据挖掘,能够有效提高挖掘的效率,效果较好。

全文