摘要

针对汽油清洁化中降低辛烷值的损失这一重点问题,提出了基于数据挖掘的辛烷值损失预测方法。首先,对影响辛烷值损失的各类因素进行了分析;然后以某石化企业为例,应用数据挖掘方法对其提供的数据进行有效的数据清洗;其次对多种复杂的影响因素进行合理的特征提取,成功提取出28个影响辛烷值损失特性的代表因素;接着利用如支持向量机回归、神经网络和随机森林等挖掘建模方法和交叉验证训练预测辛烷值损失的模型。结果表明:基于数挖掘方法构建的随机森林模型能够更加准确地预测辛烷值的损失,它在辛烷值损失的影响因素特征提取和预测计算方面表现出较强的能力,能更好地为汽油清洁化服务。