摘要

在有序的数据流时间序列当中发现异常序列是网络入侵、灾害监测、故障检测、股市分析、医疗诊断等领域当中的重点工作。为此,针对基于相似度、基于偏差以及基于密度的序列异常检测方法存在的检测精度低、效率差的问题,研究序列模式匹配在大数据流频繁序列异常检测中的应用。采用基于线性回归模型和残差分析方法对大数据流进行聚类,根据聚类结果结合分段法提取大数据流频繁序列特征,通过计算序列特征之间的距离实现序列模式匹配对比,实现异常序列检测。最后通过仿真实验测试序列模式匹配在大数据流频繁序列异常检测中的应用效果。实验结果表明,与基于相似度、基于偏差以及基于密度的三种序列异常检测方法相比,在序列模式匹配方法应用下,检测精度提高了2.4%,7.3%,10.1%,检测时间减少了4.1 s,11.7 s,11.4 s。所提序列模式匹配方法更有利于完成序列异常检测。

全文