摘要

为进一步提升区域供水预测模型的准确度与泛化能力,从应用场景分析、数据预处理、特征选取等角度,建立循环神经网络并引入数据异常识别和修复机制,在数据处理过程中对基于K-means聚类和Isolation Forest的异常点检测进行比较,并依据时间序列特性,提出区别近邻均值的时序均值修复方法。深度学习框架下,采用LSTM学习算法,以拟合效果、泛化损失作为评估指标,针对区域供水进行小时级预测。分析结果表明,数据异常识别和修复的预处理机制的引入,使得区域供水预测模型拟合及泛化能力进一步提升,且方法可行、有效。