摘要
基于1970—2021年中国大陆及边邻地区地震目录、地震序列目录和历史地震震源机制资料,参考以往研究和震后趋势预测实践,构建基于地震观测数据的机器学习序列类型判定特征样本数据集。基于地震序列分类,设置多震型、主余型、孤立型3类样本标签,初步提出44个可用于机器学习地震序列类型判定的备选特征,包括主震及震源机制相关参数、历史地震序列类型、序列衰减和G-R关系相关参数、震级及频次相关参数。以44个备选特征为基础,变换震级下限、统计时段等参数,可以扩充出更多的机器学习备选特征。基于特征与标签之间的关联特性,评估特征对序列分类的重要性。宏观来看,震级相关参数、G-R关系和序列衰减相关参数、历史地震序列类型、震源机制相关参数等特征对序列分类有贡献,其中震级相关参数特征与标签之间的互信息值明显较大且排序稳定。补齐缺失特征不但能够增加可用的训练和检验样本,还可明显提升特征与序列类型之间的关联性,这意味着恰当的数据预处理在一定程度上有可能提高特征的序列分类能力。添加原始数据的交互特征是拓展可用特征数量的重要方式之一,非独立特征经信息交互处理之后显示出与序列标签更强的关联性,这意味着特征选择应以模型预测效能的综合评价结果为准,不宜过分强调特征参数的独立性。
-
单位中国地震台网中心; 中国地震局地震预测研究所