摘要
面对当前海量网络日志数据积累的现代社会,人们迫切希望从浩瀚的数据中提炼出有价值的信息。因此,结合分布式系统和当下大数据处理技术,完成了分布式Web日志分析系统的设计和实现。系统结合实时计算和离线计算技术,实现了对站点的入侵检测和运行状态监控分析。同时,将数据挖掘的相关理论应用到系统中的访问者行为分析模块,实现了对访问者行为轨迹的分析,并将分析结果以友好的可视化界面展示给网站运营者,从而达到日志的自动化采集、分析和结果可视化分析处理。
-
单位南阳理工学院