摘要
现有非线性相关分析方法准确性低、计算代价大,因而不适合大规模、高维度台风轨迹数据相关分析.针对这一问题,首次将希尔伯特-施密特独立准则经验估计(Hilbert-Schmidt independent criterion empirical estimation, HSIC0)引入到台风移动轨迹相关研究中,提出了一种基于标准化互信息(normalized mutual information, NMI)结合HSIC0的多因素相关分析方法.该方法首先利用NMI来过滤掉台风数据中相关性低的冗余因素,然后采用XGBoost机器学习模型来剔除掉无效因素,从而降低后续计算代价.在此基础上,采用基于HSIC0的多因素相关分析方法对台风数据进行了分析,挖掘出了相关性较强的台风移动轨迹影响因素组合,从而提高了台风移动轨迹的预测精度.真实台风数据集上的一系列实验结果表明,提出的方法在MSE,MAE,R2指标上均优于NMI、Pearson相关系数、距离相关系数等分析方法.
- 单位