基于用户访问树的分布式Web日志挖掘算法

作者:陈宝国; 宋旸
来源:成都工业学院学报, 2021, 24(01): 26-29.
DOI:10.13542/j.cnki.51-1747/tn.2021.01.007

摘要

为了提高对分布式Web日志数据的准确挖掘能力,提出基于用户访问树的分布式Web日志挖掘算法。构建分布式Web日志的信息分布式检测模型,采用模糊信息粗糙集调度方法进行分布式Web日志信息的结构重组,提取分布式Web日志的统计特征量,采用用户访问树特征聚类方法进行分布式Web日志数据的空间分布式重组,结合粗糙集特征匹配方法进行分布式Web日志的离散融合处理,对多层分布式数据库中的主成分特征分量进行关联规则融合,结合信息融合结果进行分布式Web日志数据的特征参量聚集式调度,提取分布式Web日志的谱特征分量,采用空间信息聚类方法,实现分布式Web日志的用户访问树模型构造,结合决策树模型构建分布式Web日志挖掘的适应度参数,实现分布式Web日志挖掘。仿真结果表明,采用该方法进行分布式Web日志挖掘的准确性较高,抗干扰性较好,提高了分布式Web日志挖掘和用户信息访问能力。

全文