摘要
耕地表层土壤有机质含量与作物生长发育密切相关,掌握土壤有机质空间分布对土壤肥力定向培养和农业生产指导具有重要意义。本研究以河南省辉县市5 922个耕地资源管理单元图斑中心点为基础数据,并分别按8∶2、7∶3、6∶4的比例随机划分训练数据集和验证数据集,以土壤类型作为辅助定性变量,利用随机森林模型模拟预测土壤有机质含量与自然环境变量(坡向、曲率、坡度、高程、土壤质地、归一化植被指数NDVI)、社会经济因子(排水能力、灌溉状况)之间的复杂非线性关系。结果表明:①当训练集与检验集中样点数量的比例为8∶2时,对应的随机森林模型总体上预测精度较高;②选用80%基础数据作为训练集时,预测得到的地图与已有图件相比,相关性达到0.859;③当用303个实地数据验证时,预测值与实测值的皮尔逊相关系数为0.595。通过对影响因子的重要性排序,发现土壤质地是研究区农用地表层土壤有机质含量的最重要影响因子。因此,随机森林模型作为机器学习和数据挖掘的有效方法,能较好地模拟输入变量与有机质含量之间的关系,预测图件与实际情况相符,但对有机质含量精细的差异不能很好体现。
-
单位郑州大学; 河南省土壤肥料站