摘要

为了有效提高电力监测异常数据识别准确率,确保异常数据识别效果,提出了基于熵值法和DEA的电力监测异常数据自动识别算法。应用数据脱敏、数据填补、颠簸去除等方式处理电力监测异常数据,还原原始电力监测数据,提升脱敏后数据完整性,降低颠簸数据对电力监测异常数据精度的影响。以经过数据处理的电力监测异常数据为基础,通过熵值法确定目标的属性和权重作为度量标准,采用基于熵值法改进的最近邻聚类算法,实现数据聚类,以数据聚类结果为输入,构建DEA模型,实现电力监测异常数据自动识别。实验结果表明,该算法数据聚类后的平均检测率约为92%,异常数据识别正判率约为95%,误判率约为3.5%,可有效识别出异常月负荷曲线的异常数据点和不同负荷量的异常数据,且识别结果与实际负荷曲线的趋势一致,具有较好的识别效果。