基于深度森林算法的油井产量预测

作者:薛永超; 袁志乾; 金青爽; 张春辉; 赵天龙; 刘佳; 李海龙
来源:科学技术与工程, 2022, 22(11): 4327-4334.

摘要

为了克服传统机器学习算法产量预测模型的缺点,以深度森林算法理论为基础,综合油井相关各项数据,建立了油井产量预测新模型。首先应用K最邻近算法(K-nearest neighbor, KNN)和Z-Score标准化方法对油井相关数据进行预处理,利用平均不纯度减少(mean decrease impurity, MDI)特征选择方法选择对油井产量影响最大的特征向量,然后将选出的特征向量作为深度森林模型的输入变量,建立深度森林产量预测模型,利用网格化搜索优化模型参数,最后在测试集上运行模型,对模型性能进行评估。研究结果表明,相对于BP(back propogation)神经网络等传统机器学习算法模型,深度森林模型的产量预测精度更高,可以准确预测油井产量,同时相对于深度神经网络等复杂学习算法,该算法参数少、调参及应用简单,为油井产量预测提供了一种新的方法和思路。