摘要
为了减少电潜泵井电流卡片工况识别分析时的人为误差,建立了使用实时电流数据的基于机器学习的工况诊断模型。首先使用特征工程的方法,对电潜泵运行过程中的电流数据提取特征值;其次使用主成分分析法对特征值进行无监督降维聚类,并将聚类后的结果与实际工况进行对比证明聚类的有效性;然后使用降维后的带标签数据,建立逻辑回归模型;最后将未经训练的数据代入模型并进行误差分析。对A油田56口电潜泵井高密度实时电流数据进行了基于机器学习完整流程的工况诊断,结果表明,该模型在降低计算复杂度的同时,成功实现了正常工况、泵抽空、过载停泵、频繁短周期运行等4种常见工况的分类识别,诊断准确度、精确度、召回率均在80%以上,F1分数85%,达到了期望的分类效果,证明了应用机器学习方法,使用实时电流数据对电潜泵工况诊断的可行性和可靠性。
- 单位