摘要
在2020年3月—2021年7月福建漳州沿海地区融合实况资料与欧洲中心细网格模式预报产品的基础上,应用集成学习中的LightGBM(Light Gradient Boosting Machine)算法建立分类预报模型以预测低能见度天气。针对样本极端不均衡的问题,在建模与检验中分别采用Bagging(Bootstrap Aggregating)技术和AUC(Area Under Curve)评分进行解决。根据有无新特征构造和模型融合划分为四种方案进行试验,同时将逻辑回归建模方案作为对比。结果表明:(1)在所有特征中,2 m露点对判断低能见度天气发生发展最为重要,2 m与1000 hPa温差的重要性次之;(2)所有建模方案均能改善模式原始预报,其中LightGBM模型总体效果优于逻辑回归模型,两者命中率相似,但前者空报率显著降低;(3)新特征构造与模型融合的技巧能够进一步改善预测性能,包含这两者的建模方案在测试集上表现更佳,其中新特征构造对模型的提升幅度更为突出。