摘要

为了提高PM2.5质量浓度预测精度,提出一种用最大相关最小冗余算法(MRMR)筛选最优特征值,高斯多项核函数(RPK)优化极限学习机(ELM)的PM2.5质量浓度预测模型。以赣州市为例,选择PM10、O3、SO2、CO、NO2、降水、气压、气温、相对湿度、风速等10个影响因子,PM2.5为目标因子,通过降维处理和核函数特征映射代替随机映射解决PM2.5的高度复杂性。结果表明,MRMR算法选出的影响因子PM10、O3、CO、NO2和相对湿度,不仅考虑目标因子与影响因子的相关性,还考虑影响因子之间的相关性,进而降低了数据维度。MRMR-RPK-ELM模型的平均绝对误差、均方根误差、平均绝对百分比误差和确定系数分别为6.35、9.618、19.89%和0.942,相较于原始的ELM模型,PM2.5质量浓度预测精度有明显提升,拟合程度较高,且具有更好的泛化能力,能准确捕捉PM2.5质量浓度的突变节点。

全文