摘要
在使用机器学习的方法对研究区进行成矿远景区预测时,负样本选取的原则与方法一直是关注的重点。基于此,以陕西省铁佛寺-汉阴地区作为研究区,分析研究区成矿模型确定证据图层,使用K-means聚类方法客观地圈定负样本选取的范围,提高负样本选取的合理性。确定选取范围后,依照不同的原则选取4组负样本点和完全随机选取的负样本点组成5组数据集,使用随机森林(RF)模型进行最终的成矿预测。使用AUC值对RF模型的精度进行评价,对于高AUC值的模型使用精度提高比(AIR)判断模型的稳定性,最终确定使用K-means聚类的第三组负样本数据进行成矿预测的效果为5组数据集中最优。可为铁佛寺-汉阴地区的矿产勘查工作提供一定的理论参考和技术指导。
- 单位