摘要
用户访问Web应用时通常触发页面跳转,生成大量网络流量。现有技术大都针对单个网页建模,忽略页面间的跳转信息。提出一种利用报文长度分布信息描述网络流量序列的自适应符号化算法,利用隐马尔可夫模型(Profile Hidden Markov Model, PHMM)从页面跳转信息中挖掘用户与Web应用的交互模式,识别用户行为,进而应用于诈骗类网站识别。实验证明,自适应符号化算法与传统的等间距和K-means符号化算法相比能最大限度保留网络流量序列的信息且耗时较少,基于PHMM的用户行为识别方法有效。
-
单位浙江警察学院