摘要

针对现有特征选择方法难以从大量的SCADA参量中挑选出重要变量的问题,基于近邻元分析算法提出一种专门适用于风电机组状态监测的特征变量选择方法。所提方法根据每个待选变量对回归精度的贡献率为各变量赋予相应的重要度权值,从而挑选出最重要的特征变量。通过分析SCADA数据中冗余变量的特点,针对性地提出了基于相关系数矩阵的去除冗余方法。采用Pearson相关系数、互信息和随机森林三种方法作为对比,以门控循环神经网络作为模型预测齿轮箱油池温度,用预测精度指标和残差控制图对各特征选择方法的选择结果进行评价和对比,结果表明所提方法的特征选择结果更加直观、冗余变量更少、预测精度更高。