摘要

传统方法缺乏对缺失数据的修复处理,导致数据清洗性能不佳。对此,提出新能源发电系统运行信息异常自动清洗方法。首先,预处理原始数据集,采用Z-score方法标准化处理数据,归一化处理数据取值范围。其次,以数据分布密度为阈值,检测异常数据和离群数据。最后,结合数据分配权重修复缺失数据,实现数据清洗。在实验中,对提出的数据清洗方法进行清洗性能的检验。结果表明,设计方法清洗发电系统运行数据时,算法的受试者操作特性(Receiver Operating Characteristic,ROC)曲线拟合良好,具有较高的数据清洗性能。