摘要
水库大坝基础设施潜在风险评估是水库大坝风险评估体系的重要组成部分,然而水库大坝基础设施数据量大、数据特征多、还存在数据缺失的情况。XGBoost算法作为一种基于决策树的集成算法,在应对大规模含有缺失情况的、具有混合类型的特征数据方面具有独特优势。为了更快速准确地对水库大坝基础设施潜在风险进行评估,提出了一种基于XGBoost的水库大坝设施潜在风险评估预测方法。首先将水库大坝统计数据进行预处理,并用该数据对XGBoost模型进行训练,然后通过GridSearch和Cross-validation计算模型最优参数,最后根据准确率、召回率等精度指标对模型进行评价。预测结果表明:XGBoost在测试集上的准确率达91.26%,相比于其他4种常规机器模型(随机森林、人工神经网络、最邻近算法、支持向量机)高出2.12%,5.59%,19.31%,38.65%,满足工程实际的要求。
-
单位水利部南京水利水文自动化研究所