燃料清洁化要求对汽油进行脱硫和降烯烃处理,同时尽量保持其辛烷值。由于现有数据具有缺失、高维等特征,笔者提出一种基于随机森林和决策树的辛烷值损失预测框架,采用缺失比率分析、数据空缺填补、方差过滤和异常值处理4个方法对数据进行预处理,并利用随机森林筛选25个变量作为主要变量。