摘要
为了能及时、准确的估算出PM2.5浓度及污染等级,分别构建了K最邻近模型(KNN)、BP神经网络模型(BPNN)、支持向量机回归模型(SVR)、高斯过程回归模型(GPR)、XGBoost模型和随机森林模型(RF) 6个PM2.5浓度预测模型,选取江西省赣州市为实验区域,采用2017~2018年逐小时气象站数据、PM2.5浓度数据和Merra-2再分析数据开展PM2.5预测实验.结果表明,缺少污染物观测数据时,利用能见度和气象因子等数据也能较好的预测PM2.5浓度.在PM2.5浓度预测精度方面,XGBoost模型最高,随机森林模型次之,高斯过程回归模型最差.6个模型的预测精度总体呈现冬季最高,秋季和春季次之,夏季最低.XGBoost模型的PM2.5污染等级预测准确率高于其他模型,综合准确率达87.6%,并且XGBoost模型具有训练时间短,占用内存小等优点.XGBoost模型的变量重要性结果表明,能见度变量的重要性最高,相对湿度和时间变量次之.本研究可为环境部门准确预测、预报PM2.5浓度提供参考.
- 单位