摘要

为进一步促进机器学习技术在玉米单产估测中的应用,以河北中部平原为研究区域,选取与玉米长势和产量密切相关的条件植被温度指数(Vegetation temperature condition index,VTCI)和叶面积指数(Leaf area index,LAI)为特征变量,通过极限梯度提升(Extreme gradient boosting,XGBoost)算法和随机森林(Random forest,RF)算法分别对玉米单产进行估测。基于组合预测思想与Shapley值理论,分别确定组合预测模型中XGBoost与RF模型权重,进而得到组合预测模型,结果表明,基于Shapley值确定的组合估产模型精度较高(R2=0.32),达极显著水平(P <0.001)。同时将组合预测模型应用于河北中部平原2012年各县(区)玉米的单产估测,结果表明,模型精度较高(R2=0.52),玉米估测单产与实际单产的平均相对误差和均方根误差分别为9.86%、831.14 kg/km2,达到极显著水平(P <0.001),且组合预测模型的精度均优于单一估测模型。研究发现,河北中部平原玉米估测单产随年份发生波动变化,呈先降低后升高的趋势。玉米估测单产以西部地区最高,其次是北部和南部地区,东部地区最低。