基于密度峰值聚类的气象灾害识别

作者:樊仲欣; 焦圣明*; 谭桂容
来源:自然灾害学报, 2023, 32(01): 171-182.
DOI:10.13577/j.jnd.2023.0119

摘要

气象灾害案例是气象业务部门归纳与总结预报经验的前提与基础,但是当需要的灾害性天气没有时空定位档案,或档案不够完整和全面,那么就势必要从海量的历史数据中逐一进行查找定位,因此针对这种海量数据中逐一查找的低效问题,应用一种改进的密度峰值聚类方法进行灾害天气识别。该方法首先以气象要素为维度计算每个数据点的密度、距离、路径、分布四大属性,然后用回归分析提取簇心并判定其灾害类型及级别,最后判定同簇剩余数据点划入对应的灾害得到识别结果,由于可以同时定位多种类型和级别的灾害天气,且无需低效地逐一比对数据和灾害等级标准,因此具有适用性强、速度快、控制参数少的优点。使用该方法基于欧洲中期天气预报中心(European centre for medium-range weather forecasts, ECMWF)的再分析资料进行聚类分析,进而识别出江苏省2018年各类气象灾害出现的时间和地点,试验结果表明:该方法可以一次性识别出暴雨、烈风、暴雪、高温、寒潮、重旱六种灾害,而k-means聚类识别率为其53%,层级聚类识别率为其77%,密度峰值聚类(Clustering by density peaks, CDP)识别率为其80%。

全文