摘要
针对数据不平衡背景下的航班延误分类预测问题,提出一种非线性赋权的极限梯度提升(eXtreme Gradient Boosting, XGBoost)算法。基于航班延误数据的不平衡特性及数据不平衡对分类预测性能的影响分析,提出基于样本比例的启发式非线性赋权方法,改进负对数似然损失函数,采用网格搜索和交叉检验法确定最优参数,并采用真实的航班延误数据集进行分类预测。实验结果表明:非线性赋权XGBoost算法能够在保持整体分类准确率的同时,能够提高对延误情况的分类预测准确率,统计指标和性能曲线均优于传统算法。
-
单位空军工程大学