摘要
钻井复杂的准确识别是钻井工程顺利开展的保障,现有基于机器学习的钻井复杂诊断方法未考虑钻井资料数据不平衡的特点,可能导致将钻井复杂误判为正常工况。基于决策树分类模型,建立了考虑数据不平衡影响的钻井复杂诊断方法:从录井资料、工程异常记录等现场资料中收集原始数据,提取钻压、钩载、排量等钻井参数,并以波动值构建样本集;引入错误分类成本以修正数据不平衡的影响,建立以最小错误分类成本期望值为分类目标的决策树模型,取代以最高准确率为目标的分类模型。将新模型应用于某页岩气水平井卡钻复杂诊断,结果表明:考虑数据不平衡后,模型能识别出传统方法遗漏的卡钻样本,并将成本期望值降低85%。文中处理数据不平衡的方法不局限于决策树模型,亦可推广至其他机器学习方法,帮助解决钻井复杂识别问题。
- 单位