摘要

面向特异性的数据挖掘中,特异性因子是一个重要概念,但其计算时间复杂度过高。使用基于采样的方法定义特异性因子即采样特异性因子(Sampled Peculiarity Factor,SPF)可在不影响精度的情况下,提高运行效率。为提高基于SPF算法的异常检测效率,提出了基于SPF的学习采样频率算法,将SPF和最优采样频率结合起来提出了实时异常检测算法。在真实数据集上进行了实验,置信度为95%时,得到的最优采样频率序列为[1/32,1/16]。仿真实时异常实验表明该算法的误检率为2%。