摘要
准确预测土壤有机质(Soil Organic Matter,SOM)空间分布对精细农业、耕地质量建设、生态环境保护以及固碳减排等均具有重要的意义。该研究探讨了基于两点机器学习方法(Two-pointMachineLearning,TPML)提高SOM空间分布预测的可行性。以黑龙江省海伦市为研究区,以气候、地形地貌、社会经济和空间位置信息等因素作为辅助变量,充分利用空间位置信息和属性相似关系,有效处理SOM空间分布异质性及其与辅助变量间关系异质性,以提高TPML方法进行SOM空间分布预测的精度。采用随机森林、基于随机森林的回归克里格、反距离权重法和普通克里格(Ordinary Kriging,OK)方法作为对比,以平均绝对误差(Mean Absolute Error,MAE)、均方根误差(Root Mean Square Error,RMSE)、预测值与真实值相关系数(r)和决定系数(R2)作为评价指标,进行不同样本量下的多组对比试验,评价不同方法的预测精度。结果表明:1)研究区SOM含量在1.775~7.188 g/kg之间,平均值为3.179 g/kg,空间分布不均匀,呈东高西低的分布趋势。2)在不同样本量条件下,与其他模型相比,TPML的预测精度均最高,其MAE(0.088~0.097g/kg)和RMSE(0.116~0.139 g/kg)均为最小,r(0.992~0.996)和R2(0.971~0.985)均为最高。3)预测值的误差标准差(理论误差)与实际误差具有相似的空间模式,说明TPML可以为预测结果提供合理的不确定性估计。综上,TPML模型可以通过同时利用空间自相关性和属性相似性来提高预测精度,该模型适用于预测具有一定空间自相关性且具有可用辅助数据的资源环境变量。
-
单位中国农业大学; 中国地质科学院地球物理地球化学勘查研究所