摘要
针对电网负荷数据存在冗余和价值密度低等问题,本文提出一种结合K-means算法与Pearson相关系数计算的集成学习方法,对负荷数据进行清洗与去重。设置仿真实验将某地区连续730日的负荷数据进行聚类、切片、排序、比对、去重等分析处理,得到清洗后的新数据集,将新数据集与原数据集代入相同的BP神经网络模型和随机森林模型进行负荷预测,实验结果表明新旧数据集具有相似的特征特性与数据挖掘潜力。与传统的数据去重方法相比,本文提出的数据清洗策略在进行训练集的预处理时,效率和准确度方面均有更好表现,可以为训练用于负荷预测的网络模型提供支持。
-
单位自动化学院; 武汉理工大学