摘要
基于国内外397组岩爆案例数据,采用模型参数优化及交叉验证技术获得最近邻、支持向量机与决策树模型最佳参数;对比主成分分析(PCA)与过采样SMOTE(synthetic minority oversampling technique)算法对3种机器学习算法预测准确率的影响,并对模型预测性能进行评估.结果表明:主成分分析对3种机器学习模型的预测准确率并无提升,不同岩爆类型的样本之间不具有较为明显的分类边界;过采样SMOTE算法仅对决策树模型有明显的提升,基于过采样建立的SMOTE-DT模型预测准确率为77.50%,高于仅对原始数据集进行标准化处理的K-最邻近(KNN)和支持向量机(SVM)模型的68.75%与57.50%; SMOTE-DT在避免高估与低估岩爆类型表现优于KNN与SVM模型,对于4种岩爆类型的F1值均大于0.7,岩爆预测性能稳定可靠.此外,采用本文构建的3种机器学习模型对山西紫金金矿进行岩爆类型预测,模型预测结果与现场观测结果相一致.
-
单位福州大学; 紫金矿业集团股份有限公司