摘要

针对水工结构长周期监测数据野值识别中存在分布假设难以满足、野值点数量受限和野值难以有效量化的问题,提出了以改进局部异常系数算法为基础的密度分簇局部异常识别方法。该方法将长周期监测数据集分为极端簇、野值簇和正常簇,在每个簇中以不同方式赋予异常可能性,得到了综合考虑自变量和效应量的异常可能性时序图,实现了水工结构长周期监测数据野值识别与量化分析。核心算法预先不使用任何分布假设,改进了局部异常系数算法可达距离的定义,扩大了高异常系数与低异常系数的差值,使得野值与其他数据点更易区分。依托实际调水工程长周期监测数据,考虑实测数据集中野值数量和位置均未知的情况,根据异常可能性计算可信程度作为回归分析模型的权重,模型预测结果与未加权重的模型相比得到了较大提高,验证了所提出方法的有效性。

  • 单位
    天津大学; 水利工程仿真与安全国家重点实验室