摘要

为解决基于机器学习的滑坡易发性建模存在的单模型分类能力弱和传统随机抽取非滑坡样本准确性不高的问题,本研究以三峡库区奉节县为例,应用优化的非滑坡样本和Stacking异质集成机器学习模型进行滑坡易发性建模研究。首先,基于地形、地质和遥感影像等数据提取16个评价指标并进行相关性分析,剔除高相关指标,构建易发性评价指标体系;其次,基于信息量模型提出非滑坡样本选取(Non-Landslide Sampling, NLS)指数;最后,应用NLS指数选取更高质量的非滑坡样本,并与滑坡样本组成训练集;采用随机森林(Random Forest, RF),轻量级梯度提升树(Light Gradient Boosting Machine, LGBM),梯度提升决策树(Gradient Boosting Decision Tree, GBDT),以及以三者为基模型的同质(Boosting)和异质(Stacking)集成方法进行易发性建模。结果表明:应用NLS指数能选取得到质量更高的非滑坡样本,提升了易发性建模精度;Stacking异质集成机器学习模型的精度最高,为0.941,优于3个同质集成模型和3个单模型,表明异质集成算法能显著提升机器学习建模的性能,是一种可靠的滑坡易发性评价方法。本研究的结果将有助于提升区域滑坡灾害风险评估的精确度。