摘要
大坝变形监控模型的优劣主要体现为模型泛化能力的高低。模型泛化能力指的是模型对训练集以外样本的预测能力,而欠拟合和过度拟合是导致模型泛化能力不高的主要原因。AIC和BIC准则是目前常用的模型识别方法,但是不能定量比较和评价模型的过度拟合程度。本文通过定义过度拟合系数OC量化模型过度拟合程度,同时采用复相关系数R定量评判模型是否欠拟合,建立了R-OC模型识别准则。首先将大坝变形监测序列划分为拟合时段数据和验证时段数据,采用全回归方法对拟合时段数据进行拟合,构建多种位移监控模型。再根据监控模型的估计值和估计误差的概率分布确定异常监测数据的预警界限,计算各监控模型的误警率FAR。最后根据不同监控模型对拟合时段和验证时段的拟合和预测误差评价指标(均方根误差RMSE、平均绝对误差MAE、平均绝对百分比误差MAPE),确定过度拟合系数OC,结合复相关系数R绘制2维散点图,并对各监控模型的泛化能力进行评价。结果表明,过度拟合系数OC同模型的误警率呈良好的相关关系:过度拟合系数OC小于1时,监控模型没有过度拟合,模型误警率FAR为0,不会发出错误预警;当OC大于1时,模型误警率FAR与OC呈正相关关系。R-OC模型识别准则一方面通过复相关系数R刻画模型的拟合精度,另一方面通过过度拟合系数OC定量评判模型的过度拟合程度,对于不同数量的待选模型,R-OC准则均能识别出拟合和预测精度都较高的模型。
-
单位四川大学; 雅砻江流域水电开发有限公司; 水力学与山区河流开发保护国家重点实验室