基于CatBoost的重金属污染场地风险等级预测模型

作者:李心治; **钦*; 胡昊; 姜会忠; 李星辰; 陆楠
来源:绿色科技, 2022, 24(24): 140-151.
DOI:10.16663/j.cnki.lskj.2022.24.011

摘要

为有效利用污染场地环境大数据,在未进行钻孔取样的情况下对重金属污染场地进行风险等级的预测评估,研究构建了基于机器学习模型CatBoost的重金属污染场地风险等级预测模型,并分析制定了模型学习样本的制作方法,依据污染行业专家知识结合场调数据特点建立指标集作为输入值,综合采用单因子指数法、地累积指数法与潜在生态风险指数法对场地内各网格地块的风险等级进行了划分并作为模型输出值。模型训练和测试结果表明:当输入特征为8项指标,即面积、硬化面积、生产经营时间、排污、地下水埋深、饱和带土壤渗透性、地下防渗措施和高密度电阻时,CatBoost性能最优,评价指标准确率为0.846、宏查准率为0.855、宏查全率为0.842、宏F1值为0.848。进一步与XGBoost、LightGBM两种机器学习模型进行了对比分析。结果表明:CatBoost模型对重金属污染地块的风险等级具有最佳的预测效果。构建的重金属污染场地风险等级预测模型可在无需采样数据的条件下对污染地块的风险等级进行预测,可为场地调查修复提供决策信息。

全文