摘要

为了利用不含硒的数据能够快速、高效、精准的圈定富硒土壤,需要构建预测富硒土壤的最佳模型。从1277个1:5万表层土壤的地球化学数据中选取502个数据组成数据集,以Zn、K2O、P、Mo、Mn、Cr、pH、D(泥盆系)为自变量,是否富Se为因变量,运用SPSS Modeler 18软件构建预测富硒土壤的二元Logistic回归模型、多层感知器神经网络模型、随机森林模型和支持向量机模型(线性、多项式、径向基、Sigmoid),并利用35组土壤样品的实测数据,进行验证。结果表明,二元Logistic回归模型、多层感知器神经网络模型、随机森林模型和支持向量机模型(线性、多项式、径向基、Sigmoid)预测和验证总体正确率分别为88.8%和94.3%、91.0%和97.1%、96.6%和97.1%、87.9%和97.1%、86.1%和94.3%、86.9%和94.3%、80.3%和91.4%,曲线下面积(AUC)值分别为0.948, 0.950, 0.993, 0.937, 0.945, 0.928和0.873,以多层感知器神经网络模型的正确率和稳定性最好。同时,本次工作发现了清洁富硒土壤及绿色富硒山稻,表明用此方法预测富硒土壤具有可行性,且可进一步拓展到地质找矿及环境监测等方面。

全文