摘要

针对大数据负载分析异常负载检测精度较低、流量耗费较高的问题,研究基于高阶统计特征的大数据异常检测方法。利用双谱值检测方法提取大数据负载中的高阶统计特征,构建高阶统计特征集合;利用人工免疫理论构建大数据异常负载检测器,以高阶统计特征集合对正常大数据负载样本编码生成集合,结合随机生成过程和高亲和力检测器克隆突变后代形成一个不成熟检测器。阴性选择算法用于将集合中的元素与未成熟检测器一一匹配,并通过低于匹配阈值的免疫耐受将它们转换为成熟的检测器,检测大数据的异常负载。仿真结果显示该方法检测结果准确率达到99.9%,耗费流量显著降低。