摘要
建立了基于Stacking集成学习下气态亚硝酸(HONO)预测模型.利用非相干宽带腔增强吸收光谱(IBBCEAS)系统获得的北京城区HONO的浓度,结合HONO的来源,选取了O3、CO、SO2、NO、NO2、NOy、温度(T)、相对湿度(RH)、风速(WS)、j(HONO)、j(NO2)、j(O1D)作为特征数据,通过对HONO的平均日变化分析,将测量时间按小时转换为新特征.分别以极端梯度提升(XGBoost)、轻量化梯度促进机(LightGBM)以及随机森林(RF)算法构建基模型,采用5折交叉验证的方式划分训练集,将基模型输出的结果作为新特征集,并将新特征集作为第二层线性回归模型的输入,通过对这两层中的模型进行训练,最终得到Stacking集成学习HONO预测模型.通过对模型的特征重要度分析和计算夜间交通直接排放所占的贡献,表明CO是模型预测中重要的影响因子,说明机动车的直接排放是该区域冬季时期HONO的重要来源.利用测试集分别对单模型和融合后模型的预测性能进行评估,3个单模型的预测结果与测量值的相关系数都达到了0.91以上,其中Stacking融合后的模型性能最好,相关系数达到了0.94,平均绝对误差和均方根误差分别为0.307×10-9和0.453×10-9,结果表明基于Stacking集成学习方式下HONO预测模型的可解释性和推广性.
-
单位中国科学技术大学; 中国科学院; 中国科学院,安徽光学精密机械研究所; 中国科学院安徽光学精密机械研究所