摘要

复杂储层由于受到储层岩性和孔隙结构等多种因素的相互干扰,使得利用传统复杂储层流体识别方法识别油、气、水性质遇到困难。基于机器学习的识别方法能够综合各种测井资料的响应特征,充分挖掘测井数据、地质数据与油气水信息之间的内在联系,可大大提高识别效果。然而,致密砂岩气样本往往出现严重的类型比例失衡,加之样本数据量过少,常呈现典型的小样本数据不平衡现象,严重限制了识别效果。以鄂尔多斯盆地青石峁高沙窝地区致密砂岩储层为研究对象,提出一种基于改进ADASYN(Adaptive Synthetic Sampling Technique)数据增强的致密砂岩储层流体识别集成学习方法。方法首先以原始致密储层数据为样本,以试气结果为标签,对储层数据进行预处理与特征分析;然后根据分析结果对训练集样本进行改进ADASYN数据增强,以消除测井样本的不平衡特征;最后,通过自适应权重集成模型输出分类结果。对同一研究区域内的35口井的测试结果表明:提出的方法的试气平均准确率为91.1%,高于基于SMOTE(Synthetic Minority Oversampling Technique)与ADASYN增强算法下的K近邻、支持向量机、随机森林、XGboost模型。