摘要

针对工业污水处理过程的复杂性和明显的非线性特征,关键的水质指标生化需氧量往往无法实时在线监测,提出了组合协方差的高斯过程回归(combinedcovariance Gaussian process regression, CGPR)建模方法来建立生化需氧量预测模型,捕捉污水数据中主导变量与辅助变量的线性和非线性关系。考虑污水处理过程中各个辅助变量之间的非线性和相关性,在模型建立之前采用随机森林(random forest, RF)算法给出辅助变量重要性评分,重要性评分高的变量作为CGPR模型的输入来提高模型的预测精度。最后,利用污水处理过程数据进行仿真研究。仿真结果表明,所提的RF-CGPR方法能够达到较好的预测效果,其中结合了线性协方差和Matern协方差的模型具有较高的预测精度。