摘要
【目的】解决传统PM2.5浓度时序预测的精度较低问题,减少PM2.5时间序列的非线性、高噪声、不平稳与波动性对预测的影响,以更精确的预测PM2.5浓度。【方法】以2014年1月1日至2022年1月31日大连市雾霾天气时PM2.5数据为例,提出了经验模态分解(EMD)、分类提升 (CatBoost)、自回归综合移动平均模型(ARIMA)组合的混合机器学习时间序列模型。并与传统自回归模型(AR)、ARIMA,以及只加入EMD方法后的混合模型进行比较。【结果】混合模型EMD-CatBoost-ARIMA较原始序列均方根误差(RMSE)改进20.76%;平均绝对值误差(MAE)改进17.4%;希尔不等系数(TIC)改进29.17%。【结论】对于高熵值的重构序列,EMD分解方法和CatBoost算法能够显著提升PM2.5时间序列模型的预测性能。相比较传统时间序列模型,EMD-CatBoost-ARIMA模型在PM2.5浓度预测上具有较高性能。
- 单位