摘要

为提高空气质量指数的预测精度,提出了差分进化算法(Differential Evolution, DE)优化极限学习机(Extreme Learning Machine, ELM)的空气质量指数预测模型,并在随机森林(Random Forest, RF)对输入特征选择时,利用LIME(Local Interpretable Model-agnostic Explanations)对单个样本进行可解释性分析,以解决特征选择时的可解释性不足的问题。即首先运用随机森林和三次十折交叉验证选取最优特征,再将筛选后的特征作为DE-ELM模型的输入进行空气质量预测。实验结果表明,与未筛选输入变量的DE-ELM、ELM、DE-BP相比,筛选了输入变量的DE-ELM模型有着较高的精度,其均方误差RMSE分别下降了54.55%、5.74%、28.21%,拟合优度决定系数R2为0.9235,与其它模型相比分别提高了12.08%、1.39%、3.60%。LIME模型很好地解释了特征选择时各个特征的贡献率,提高了训练模型的可信度。