摘要

风速-功率曲线广泛应用于风电机组的功率预测、状态监测和故障诊断,其主要构建方法是使用风电场SCADA(Supervisory Control And Data Acquisition)数据进行拟合。然而由于弃风限电、仪表故障等因素,SCADA数据中存在部分功率异常数据。为保证拟合结果的准确可靠,应首先剔除这些异常数据。文中提出了一种风电机组功率异常数据剔除方法:首先使用分位数方法剔除距离正常数据较远的离散点,而后结合K-means聚类方法和改进时序方法剔除中部堆积点,最后使用分位数方法和DBSCAN聚类方法的组合方法剔除距离正常数据较近的离散点。文中分别使用仿真数据集和实测数据集对分位数方法、基本时序方法及文中方法进行对比测试,结果表明,文中方法最优,对中部堆积点和离散点均有良好剔除效果。