摘要

无监督时序异常检测方法因标注成本低而广受关注,但传统方法一般基于两个假设:1)服从独立同分布假设,即假设时序数据样本之间和属性之间不存在依赖关系;2)高净度启动假设,即假设可拥有完全正常态的时序数据集进行训练。以上假设在实际场景中往往难以满足。为此,提出一种基于边缘异常候选集的迭代式主动时序异常检测算法(EraseMTS)。首先,利用一种基于多粒度时序特征学习方法捕捉子序列内和子序列间的依赖关系,并在此基础上对原始多元时序数据进行再表示;其次,提出一种利用边缘异常候选集的选择策略,以子序列异常得分为基础,同时考虑到其异常程度的不确定性,选择出待人工交互的范围;最后,提出一种迭代式子序列权重更新机制,将异常反馈信息融入无监督异常模型的训练过程中,通过迭代方式不断优化初始训练模型性能。在UCR时间序列库中的4个数据集和1个人工合成数据集上对所提算法的检测性能、可扩展性和稳定性进行验证,实验结果表明该算法能够有效且稳定运行。

  • 单位
    计算机软件新技术国家重点实验室; 南京大学