热工过程海量数据的高质量样本提取方法及应用

作者:何康; 汪勇; 陈荣泽; 任少君; 司风琪*
来源:发电设备, 2023, 37(01): 59-64.
DOI:10.19806/j.cnki.fdsb.2023.01.011

摘要

提出了一种面向热工过程海量运行数据的高质量样本提取方法,通过主成分分析(PCA)提取系统隐变量,采用基于稳态权重的合成少数类过采样(SWSMOTE)来补充少数类工况样本。以燃气轮机为工程算例,验证所提算法的有效性。结果表明:提出的高质量样本提取方法可将原始数据数量压缩到10%左右,模型平均均方根误差从0.042下降至0.031,模型训练时间减少90%。

  • 单位
    上海发电设备成套设计研究院有限责任公司; 东南大学

全文