摘要

为了解决上网行为信息描述维度过高,且在海量用户上网流量行为数据中分析用户流量行为的偏好特征较为困难的问题,提出一种基于大数据分析技术的上网行为信息特征快速挖掘方法。结合爬虫技术从导航网站和分类目录子网页获取网站类别标签集,并对用户登录端的操作系统进行识别,结合统计分析技术和网络流量特性构造一个完备的特征集,对用户上网流量行为进行全面描述。选取适用于用户上网流量行为分析的优化特征集,通过关联分析方法挖掘出用户上网流量行为的偏好特征。实验结果表明,所提方法能够快速挖掘出上网行为信息特征,且能量消耗较少。

  • 单位
    国家计算机网络与信息安全管理中心