摘要
地表水环境水质监测是保障人类和生态环境健康的必要手段,尝试使用机器学习开发水质预测模型对高效开展地表水水环境质量监测和评估具有重要意义.本案例研究旨在评估6种机器学习模型预测水质指数(CWQI)的性能,包括多元线性回归、回归决策树、支持向量回归、弹性网络回归、随机森林和极端梯度,并使用Shapley值和SHAP值评估各变量对模型的重要性.研究发现,各模型在预测CWQI方面均具有良好的性能,且随着具有显著性相关性的输入变量个数增加,各模型预测性能呈上升趋势.在最佳输入变量方案下,随机森林(RMSE=0.233,MAE=0.173,RSQ=0.902)与极端梯度提升(RMSE=0.234,MAE=0.179,RSQ=0.893)的预测性能最佳.SHAP分析显示,TP、CODCr和NH3-N的浓度对CWQI的预测具有较大影响,揭示宜春市未来需加强N、P污染的防治以严防水质反弹.本研究所构建的水质预测模型提供了一种更高效、更低成本的CWQI预测方法,辅助水质监测工作者在仅获得部分水质参数的基础上,就能对该点位水质指数进行预判.本研究为深入开展基于机器学习的地表水水环境质量评估研究提供案例支撑.
-
单位河海大学; 浅水湖泊综合治理与资源开发教育部重点实验室