摘要

目的 对目前国内外常见的不同模型方法模拟的PM2.5浓度数据集进行时空变化及模拟效能的比较。方法 收集了2013—2020年国内外公开发表或共享的9套全国PM2.5浓度模拟数据集。通过统计学分析和ArcGIS软件制图功能对9套PM2.5浓度数据集的时空分布趋势进行对比。采用PyCharm软件对4套日值模型模拟的数据集进行回归评价分析。结果 通过比对分析发现,不同模型在局部地区的模拟值高低、范围存在一定差异,但是各类模型模拟结果空间分布整体相似,呈现中东部高,西部偏低的空间趋势。除GBD数据集外,其余8套数据集的PM2.5浓度总体呈现降低趋势,季节上呈现出冬季最高、春秋次之、夏季最低的季节规律。日值模型中随机森林模型模拟效能最佳,R2为0.76,且具有较低的均方根误差(RMSE,21.96)。月值模型中时空—极端随机树模型模拟效能最佳,R2为0.98,且具有较低的RMSE(3.26)。结论 各个模型模拟得到的PM2.5浓度时空分布相似。其中非线性机器学习模型的模拟效能优于大气化学模型和线性回归模型。未来可综合非线性和集成机器学习等模型的优点,采用集成模型来模拟PM2.5浓度数据,进一步提高模型的时空分辨率和模拟效能。

全文