摘要
为了消除特征维度不足和稀疏数据对预测模型带来的负面影响,提出一种基于奇异值分解(SVD)和集成学习的航班离港延误预测方法。使用SVD对类别特征信息挖掘的同时,增加特征维度;采用LightGBM作为集成学习的特征转换器,将树中每个叶节点信息作为特征向量送入到Logistic模型进行离港延误预测。实验结果表明:SVD和集成学习方法均能够大幅度提高预测准确度,准确度达94.9%,为航空枢纽提供重要的参考和使用价值。
-
单位自动化学院; 北京信息科技大学