摘要

降雨是众多气象要素相互作用的结果,气象数据具有类型复杂、不定性、产生速度快、数据量大等特点,增大了降雨预测模型处理气象数据的难度。针对降雨预测方法要求气象要素之间相互独立,但很多气象要素相互关联,降低了预测的准确性和效率的问题,为了提高降雨等级的预测准确性与效率,提出一种基于Map Reduce的改进加权朴素贝叶斯算法(WMNBC)。首先根据气象数据相应条件属性、类属性及其它所有条件属性三者之间的相关程度,提出一种信息密度的概念,并结合对应条件属性取值数目设计一个新的属性赋权方法,然后建立基于MapReduc的WMNBC降雨等级预测模型,最后对实际降雨等级进行仿真测试。仿真结果表明,相比NBC和HWNN算法,WMNBC算法可以更加准确的预测降雨等级并提高预测效率,为降雨等级预测提供了新的途径。