摘要

准确预测地震动强度参数(峰值加速度PGA、峰值速度PGV等)对于震后应急和地震危险性概率分析至关重要.作为地震动强度参数预测的新手段,机器学习算法具有优势,但也存在可解释性差和难给出预测结果不确定度的问题.本文提出采用自然梯度提升(NGBoost)算法在预测结果的同时提供其不确定度,并结合SHAP值解释机器学习模型.基于NGA-WEST2强震动数据库,本文训练出了适合预测活跃构造区地壳地震的PGA和PGV概率密度分布的机器学习模型.测试集数据PGA和PGV的预测值与真实值的相关系数可达0.972和0.984,并可给出预测结果的合理概率密度分布.通过SHAP值,我们从数据角度弄清了各输入特征(矩震级MW、Joyner-Boore断层距Rjb、地下30 m平均S波速度VS30、滑动角Rake、断层倾角Dip、断层顶部深度ZTOR和VS达到2.5km·s-1时的深度Z2.5)对机器学习模型预测结果的影响机理.SHAP值显示,基于NGBoost算法的机器学习模型的预测方式基本与物理原理相符,说明了机器学习模型的合理性.SHAP值还揭示出一些以往研究忽视的现象:(1)对于活跃构造区地壳地震,破裂深度较浅(ZTOR<~5 km)时,ZTOR的SHAP值低于破裂深度较深(ZTOR>~5 km)时的值,表明浅部破裂可能主要受速度强化控制,地震动强度较弱.并且ZTOR的SHAP值随ZTOR值增大而减小,表明地震动强度可能还受破裂深度变化引起的几何衰减变化影响;(2)破裂深度较深时,ZTOR的SHAP值随ZTOR值增大而增大,表明深部破裂的地震动强度可能受和破裂深度变化相关的应力降或品质因子Q的变化影响;(3)Z2.5较小(Z2.5<~1 km)时,Z2.5的SHAP值的变化规律对于PGA和PGV预测是相反的,表明加速度和速度频率不同,受浅层沉积物厚度变化引起的共振频率变化影响不同.