摘要

基岩类型的判别是地质调查中十分重要的内容,也是开展油气勘探和矿产勘探的重要基础工作。本文采用决策树、随机森林、XGBoost、LightGBM四种机器学习的方法,实现了基于地球化学采样数据的基岩类型判别。以15种地球化学元素含量及其局部空间自相关莫兰指数和地形因子为特征,训练了不同的分类模型,通过10折交叉验证对模型做出了验证与评价。结果表明,集成学习算法的分类效果优于决策树,其中XGBoost和LightGBM表现最好,对复杂的高维空间数据和不平衡数据有较强的处理能力。此外,本文通过构建的分类模型成功地实现了对第四系沉积物下伏基岩类型的预测,Voronoi图可视化结果表明,预测基岩类型与其周围真实基岩类型基本吻合,能初步划出基岩类型的分界线。因此,利用地球化学采样数据来判别其下伏基岩类型是可行的。