摘要
为了准确预测空气中颗粒物的浓度变化情况,减少空气污染给居民的生产生活带来的危害,该研究提出一种基于 RF-Kmeans-LIBSVM 的大气颗粒物浓度预测模型。首先采用 RF 算法对影响 PM2.5和 PM10 浓度的因子进行重要性评估,选择出影响最大的 2 个因子作为聚类属性,然后采用 Kmeans 算法对空气污染监测数据进行聚类,把 PM2.5 和 PM10序列划分为相似性较高的若干类,最后运用经聚类分析之后的训练样本建立 PM2.5 和 PM10浓度预测模型。以乌鲁木齐市监测点 2015 年 1 月 1 日~2020 年 12 月 31 日的 PM2.5 和 PM10 浓度日均监测数据为例,使用改进方法和传统方法分别进行预测。结果表明:与传统支持向量机相比,改进后的模型的预测准确率明显提升,对于 PM2.5,误差评价指标 MAE 和RMSE 分别下降 33.1% 和 26.5%;对于 PM10,误差评价指标 MAE 和 RMSE 分别下降 15.7% 和 12.7%。研究说明利用 RF-Kmeans 聚类分析的方法来提高传统支持向量机在 PM2.5和 PM10 浓度预测中的泛化能力具有可行性。