摘要

将机票价格预测定为回归问题,以历史机票数据作为研究对象,寻找影响机票价格的特征为研究目的。首先对数据集进行数据预处理,归一化消除量纲差,再将0/1整数规划确定为特征提取的子集形式,用9种特征选择方法选择影响机票价格的特征子集,构建包括原始数据集的5个数据子集。运用线性回归模型、梯度提升模型、随机森林模型、CART决策树模型、K近邻模型和MLP模型评估5个数据子集预测结果的优劣。从结果表明,MLP模型应用于5个子集的预测效果均表现良好,MSE值最小达到0.000 31,MLP模型在subset_4数据子集上的R2值为0.999 73,说明subset_4是机票价格预测的最优解。