摘要

地层砂的粒度特征值d50(筛析曲线累计质量分数50%对应的粒径值,μm)是防砂设计中的关键参数,为获得粒度纵向分布剖面,开展了基于机器学习方法的储层粒度与测井曲线响应关系研究。经典机器学习往往缺少模型内部的特征提取过程,而且采用单一采样点作为输入,缺失相邻数据关联关系反映层位信息。考虑到储层的地质连续性,利用测井曲线趋势和背景信息,将深度相邻数据点作为机器学习特征值,提出了一种基于多采样点的粒度剖面预测方法,构造和训练了基于随机森林(Random Forest)、支持向量机(Support Vector Machine)、Xtreme Gradient Boosting Tree(XGBoost)、人工神经网络(Artificial Neural Network)的预测模型。研究结果表明,与单点映射模型相比,考虑储层纵向地质连续性的各模型预测精度均高于单点预测,其中五点映射的ANN模型(ANN-5)预测效果最好,测试集d50预测相关系数最高为0.819,误差MAE最小为9.59,证实了多个采样点作为输入隐含利用了部分地层信息,有效地提高了预测精度。研究了特征点密度对模型准确率的影响,对训练集二维输入空间中样本的特征点高斯核密度分布以及测试集样本点处的训练集特征点密度进行估算,得出在高密度区域中的测试集样本点的RMSE普遍较低。当增加训练样本数量时,模型预测精度将进一步提高。采用层次分析法确定影响模型选择各因素的权重,通过模糊综合评判法优选机器学习模型,根据优选出的模型对临近区块储层粒度剖面进行预测,预测结果很好地捕捉了粒度变化趋势,模拟了其峰值。