摘要
大数据流序列异常检测过程中易受噪声数据的干扰,导致检测准确率和效率较低,为此提出基于改进PSO-PFCM聚类的大数据流序列异常检测算法。采用离散小波变换消除大数据中存在的噪声,避免检测过程受到噪声数据干扰,通过主成分分析法提取降噪后大数据流序列特征,采用基于改进PSO-PFCM算法优化大数据流序列特征的初始数目与中心,引入相似性区分矩阵模型,得到大数据流序列特征的异常数据,完成大数据流序列的异常检测。结果表明,所提方法的检测效率高,检测时间始终低于20s,检测准确率一直稳定保持在85%以上,召回率最高达到90%,能够有效检测出数据流中的异常序列,且具有较高的应用性。
-
单位沈阳航空航天大学; 中国刑事警察学院