摘要
测井数据中存在大量与岩性无关的冗余信息,且各类岩性标签数据分布不均匀,严重影响岩性识别准确率,现有测井岩性识别算法无法有效解决岩性类间不平衡问题。为此提出了一种针对不平衡样本集的集成学习岩性预测方法KSMOSEL:首先以录井岩性数据为岩性样本标签,将测井曲线作为模型输入;然后将K-means算法与合成少数类过采样技术(SMOTE)相结合形成K-means-合成过采样算法,即KS采样算法,对岩性样本集进行平衡化处理;最后将采样后的数据集用于构建集成学习模型并训练,采用多个分类器模型融合构成强学习器,通过“软投票”方式预测岩性类型。以Hugoton油气田测井岩性数据为基础,采用改进不平衡样本集的集成学习岩性预测方法对岩性进行分类,并将识别效果与传统的分类模型:支持向量机、K最近邻分类、决策树、XGBoost和随机森林等模型进行对比。试验结果表明:KSMOSEL方法具有更高的精度,岩性识别准确率达到94.28%;KS采样之后,支持向量机、K最近邻分类、决策树、XGBoost、随机森林、GBDT和集成学习等模型岩性识别准确率分别提高了18.68%,12.03%,3.77%,10.23%,24.77%,16.69%,19.37%,在测井岩性数据分布比例不平衡时极大地提升了岩性识别的准确率。
-
单位西南石油大学; 油气藏地质及开发工程国家重点实验室