摘要
土壤重金属受人为和自然因素综合作用,其空间异质性强,存在区域均值和方差的非平稳性,稀疏样本下未知点估计精确度低,土壤环境质量现状精准估计和风险评估困难。基于此,提出了随机森林-序贯高斯模拟混合模型(RF-SGS),选取多种自然因素和人为因素作为辅助变量,充分考虑土壤属性指标的空间自相关性以及环境变量属性相似性,解决传统插值中极端值和空间连续性模式敏感存在的局限性,为非平稳区域精准估计总体提出可行性方法。以北京市顺义区采样数据为例,采用MMSD抽样方法对样点抽稀,对原始采样数据进行不同采样密度的对比实验,用随机森林-序贯高斯模拟混合模型(RF-SGS)、序贯高斯模拟模型(SGS)、趋势面-序贯高斯模拟混合模型(TR-SGS)和随机森林模型(RF)对土壤重金属Cd的空间分布进行模拟,从统计特征和空间结构等方面比较模拟结果,分析误差产生的原因,进一步验证方法有效性。结果表明,在7种采样密度下,预测精度由低到高排序为:SGS<TR-SGS<RF<RF-SGS,RF-SGS估算精度最高且Cd含量空间分布也最接近原始数据分布。RF-SGS 模型可以作为稀疏样点下土壤重金属空间模拟的一种有效方法。
-
单位北京农林科学院; 数理学院; 防灾科技学院; 北京市农林科学院; 中国地质大学(北京)