摘要
结合社会媒体大数据获取城市降雨灾情数据和开展灾害风险评估是一种新的可行途径。但互联网数据量大,有效处理数据是工作中的难点。为此提出利用社交媒体数据,并基于降雨专业词汇、广州地区语言特色、支持向量机算法以构建降雨灾情文档分类模型。同时根据数据采集与预处理、降雨灾情文档分类模型、灾情权重分级和热点分析的流程设计了广州线上降雨灾情检测系统。该系统采用B/S架构,利用WEB与GIS技术,实现了灾情应用管理、风险告警、数据分类、数据过滤、数据采集的功能。实际运行效果表明,系统利用机器学习算法解决了大量数据处理效率低下的问题,同时通过灾情热点分析结合利用气象雷达、自动站观测数据进一步提高灾情提取的准确度,以自动检测和评估降雨雨情、灾情的状态是可行的,在灾情收集业务应用上具有一定的参考价值。
-
单位广州市气象台; 中山大学