摘要
掌握近地表气温的空间分布对于科学理解生态环境变化和陆地-大气热力学相互作用机理等至关重要,然而气象观测站在地理空间上分布不均,为区域的气温插值带来了挑战。本文以全国711个气象站点的月平均气温为基础数据,分析了气温与经度、纬度和高程的相关性,利用随机森林、支持向量机、高斯过程回归三种机器学习方法,对中国陆地区域的气温进行了空间插值,并与反距离权重、普通克里金以及ANUSPLIN等传统的插值方法以及全球土地数据同化系统(Global Land Data Assimilation System,GLDAS)气温数据产品进行对比。结果表明:(1)在整个中国陆地区域,利用机器学习进行气温插值的精度明显高于传统的反距离权重和普通克里金插值,并且机器学习方法明显提高了夏季的气温插值精度(R2);(2)在三种机器学习方法中,高斯过程回归表现最好,支持向量机次之,然后是随机森林,ANUSPLIN具有较高的插值精度,但是整体低于高斯过程回归模型;(3)在气象站点稀少且分布不均匀的青藏高原地区,三种机器学习方法插值精度明显高于反距离权重和普通克里金方法,且整体优于ANUSPLIN的结果,尤其是在夏季,机器学习插值结果的精度明显提高;(4)与现有的气温数据产品GLDAS进行对比发现利用机器学习算法得到的气温数据误差更小,精度更高。本文的研究结果证明了机器学习算法在气温插值中的有效性,对气温相关的各领域研究具有积极意义。
- 单位