摘要

为更加准确地预测航班的延误率,基于2015年7月国内所有29.89万次航班数据,对大数据进行数据挖掘处理,筛选可利用的数据,然后对数据进行定量化处理,用量化后的数据进行延误预测。首先,对航班数据进行预处理,并通过影响因素分析确定航班延误的主要影响因素;然后,基于最小二乘法进行参数标定,建立组合预测模型预测航班延误率。采用SPSS对组合预测模型进行求解与检验,得出7月份航班的延误率为43.33%,而全国航班的实际延误率为46.79%,验证得出航班延误判断正确率高达81.86%;组合预测模型对8月份的航班的预测结果显示,该模型是可行的。结果表明,组合预测模型能有效预测航班延误情况,能为航空公司、机...