摘要

建立科学、有效、准确的空气质量预测系统,对于保护人们的身体健康和促进社会的和谐稳定具有重要的科学价值和实际意义。研究聚焦化工园区,基于物联网背景下企业排放实时数据,融合气象信息,采用多种有监督式机器学习(决策树、多元线性回归、Lasso回归、支持向量机、Xgboost、梯度提升机、Light GBM、MLP(多层感知觉神经网络))及改进的集成学习Stacking策略实现化工园区空气质量的预测,并识别影响大气污染的关键因素。结果表明:(1)Stacking策略下的预测框架与单模型预测结果相比有统计学意义上的显著提升。(2)在Stacking策略中,初级、次级学习器的选择策略影响预测的精度和泛化性,最佳模式为初级采用强学习器,次级使用线性模型。(3)在同一园区、不同企业污染物不同排放口对空气质量影响不同,研究结论可为政府监管部门对化工园区的治理和管控提供决策支持。