摘要
高分辨率气象资料是精细化气象业务服务的重要数据基础,文章利用2020年1月—2021年3月逐小时的2 m气温网格数据,选取海拔、经度、纬度等地形因子,综合应用LightGBM(LGB)、XGBoost(XGB)、梯度提升树(gradient boosting tree, GBT)和随机森林(random forest, RF)4种机器学习方法,实现1 km分辨率的2 m气温网格数据降尺度至100 m,并对4种机器学习降尺度结果进行加权融合。将不同模型降尺度结果与双线性插值结果对比,结果表明:各降尺度模型结果与站点观测值较为一致,LGB,XGB和RF模型与双线性插值降尺度结果空间结构相似,但更为精细;各降尺度模型具有相同的时空误差分布特征,与双线性插值结果相比,LGB,XGB和GBT的数据精度均有明显提高,均方根误差(root mean square error, RMSE)分别降低了5.2%,4.1%和4.6%,而加权融合后的RMSE降低了5.9%,优于单一机器学习模型;LGB,XGB和GBT模型对不同地形条件下的降尺度结果均具有一定改善,尤其对高海拔地区(海拔在600 m以上)的改进效果更为显著,LGB,XGB和BGT和融合模型的相关系数分别提高了0.45%,0.40%,0.63%和0.66%,RMSE分别降低了9.1%,8.0%,12.7%和13.1%。研究显示,多种机器学习加权融合的降尺度模型兼顾了提升空间分辨率和保持数据精度两方面的要求,适用于研究区2 m气温数据的降尺度研究,为研制高分辨率数据产品具有一定参考意义。
- 单位