摘要

时间序列数据是一类常见的多维复杂类型数据,它客观记录了观测系统随时间次序而变化的、在各观测时刻点的重要信息。时间序列数据具有海量性、高维性、复杂性等特点,直接对原始水文时间序列进行异常检测需要花费大量的时间,因此提出一种基于两阶段的水文时间序列异常检测方法。该方法通过分段线性表示方法对原始时间序列进行表示,提取子序列的斜率,极值差和均值三个特征值来表示原始时间序列。第一阶段在每个子序列为一个三元组的基础上用层次聚类算法对数据进行聚类,得到聚类结果。第二阶段基于聚类结果计算每一类的异常因子,根据异常因子判定异常模式。为验证该方法的有效性,采用龙门站的实测数据和人工合成数据进行实验检测,取得了较好的效果。

  • 单位
    淮河水利委员会水文局