摘要

综合能源数据的采集与分析是构建综合能源系统的基础和前提,由于数据采集过程中存在系统故障、线路检修等随机因素的制约,其数据常存在异常和缺失情况。为解决上述问题,提出了基于改进K-Means聚类和误差反馈的数据清洗方法,对异常数据进行识别和插补。将异常数据分为不符合用能业务特性的坏数据和缺失数据两类。针对坏数据问题,提出了基于改进K-Means聚类的异常数据识别方法,其中采用Davies-Bouldin(DB)指标解决聚类数K的选取问题;针对缺失数据问题,提出了基于误差反馈的异常数据组合式插补方法。为验证所提方法的有效性,从某园区5个用户4个月的用电数据中选取40组数据,前20组作为样本集以确定插补权重,后20组作为验证集进行验证与对比,结果表明,所提方法具有更高的稳定性与可靠性。