摘要
电耗预测是原油管道运行能耗管理的重要依据,有助于输油企业制定批量调度与负荷分配等运行方案。相较于工艺计算和统计分析等传统预测方法,机器学习方法在处理高维、非线性的管道运行数据时具有更优的预测效果。但由于数据获取成本很高、数据存在安全保密性等原因,往往将造成可获取的管道数据集是小样本,以此建立的模型预测精度难以满足实际生产需求。为提高模型在小样本集情况下的预测能力,通过利用数据生成理论提出一种自取法和支持向量机相结合的管道运行电耗预测模型。利用自取法对原始小样本集数据进行扩充,根据原始数据集的分布规律生成虚拟样本,填充样本信息间隔,避免出现过拟合问题;使用粒子群算法对支持向量机的超参数进行优化,提高模型的拟合能力。以国内某保温原油管道的两站场为例进行建模预测分析,预测结果表明,相较于只利用原始数据集,添加虚拟样本后多数预测值更加贴近真实值,且当两站场分别加入50组虚拟样本后,其月度电耗预测结果的平均绝对误差(MAE)分别降低了32.38%和29.74%,证明通过向原始数据集中添加虚拟样本以扩充数据集规模,能够有效降低预测误差,提高模型的拟合能力,这为管道数据获取成本过高、企业重视数据安全等原因造成的可用样本不充足问题提供了一种新的解决思路。
-
单位中国石油天然气集团公司; 中国石油大学(北京)