针对风力发电机组SCADA监测数据海量、高维、复杂的特点,提出一种基于流形半监督K均值聚类的风力发电机组故障诊断方法。对风力发电机组SCADA数据进行分析,提取风力发电机组状态参量组成特征数据集,优化了传统K均值聚类算法,以流形距离作为相似性度量,对SCADA数据进行半监督K均值聚类分析。实验结果表明:改进的算法比传统K均值聚类算法能更有效识别风力发电机的状态。