摘要
社交媒体地震舆情数据可实时反映灾区现状,为震后应急提供较好的地震灾情舆情研判服务。选取新浪微博作为数据源,对接EQIM,采用新浪微博开放平台API与分布式网络爬虫相结合的方式获取地震舆情数据。在数据清洗和基于fastText地震相关性分类模型进行数据预处理的基础上,应用MySQL关系型数据库,设计并实现我国大陆地区准实时新浪微博地震舆情数据库及管理平台。现阶段,该数据库收集了2021年1月1日至2022年3月31日我国大陆地区3.0级及以上地震447次、地震舆情数据732 949条,实现数据下载、快速查询及精确查询,方便数据查询与管理,有助于震后舆情监控与灾情快速获取。
-
单位中国地震局地球物理研究所; 中国地震应急搜救中心; 北京市地震局