基于分布式随机森林的火电厂燃烧系统设备建模方法

作者:宗学军; 冉维周*; 王国刚; 连莲; 何戡; 李萌
来源:信息与控制, 2021, 50(05): 574-581.
DOI:10.13976/j.cnki.xk.2021.0029

摘要

本文提出一种基于分布式框架改进随机森林算法的火电厂燃烧系统设备数据建模方法,即利用多元共线性检验改良逐步回归,筛选工业流程中的最优变量.将处理后的变量数据应用于Hadoop平台下,结合Mapreduce和Spark分布式框架,对传统随机森林算法进行并行式优化.研究结果表明基于Hadoop的分布式随机森林算法有效地提升了训练效率和数据处理速度,建立的模型具有较高准确度,泛化能力较强,具有较高的工业研究价值.