摘要

不同类型机器学习模型对地下水砷的预测存在较大差别,现有机器学习模型不能较好模拟预测地下水砷的空间分布。基于黄河下游豫北区1 081个浅层地下水砷质量浓度实测值,结合人类活动、气候、沉积环境、土壤理化特征、水文地质等环境因子,构建以随机森林(RF)、极端梯度提升(XGBoost)、支持向量机(SVM)为基学习器,线性判别分析(LDA)为元学习器的堆叠(Stacking)集成学习模型,对研究区高砷地下水空间分布进行预测,并对关键环境变量进行识别。结果表明:研究区地下水砷质量浓度为0.01~/异性(Specificity)和敏感性(Recall)最大;研究区高砷地下水主要分布在太行山前洼地及黄河决口扇地区,占总面积的33.81%;黄河决口情况、年均气温、年降水量、高程、水力梯度是影响研究区高砷地下水分布的重要的环境变量,沉积环境与地下水中砷富集显著相关。