摘要

行程时间预测是"智慧高速"建设的重要内容之一,大量交通领域的专家与高校学者已针对高速公路行程时间预测进行深入研究。笔者以广西高速公路联网收费数据为基础,旨在提出一种适用于广西高速公路的行程时间预测方法。首先利用出口原始收费数据表中的出口时间和入口时间字段计算各车辆的行程时间,接着根据规则剔除异常数据,以获取可以真实反映行程时间的数据集;然后构建行程时间的特征工程,将车型、车辆种类、周天、小时作为特征变量,用one-hot编码对其进行处理;再建立基于随机森林算法的高速公路行程时间预测模型;最后以广西高速公路六景至南宁东段的数据为研究对象,对模型进行训练以及对预测结果进行验证。结果表明,模型预测精度总体较好,平均绝对百分比误差(MAPE)和(MAE)分别为12%和205 s,为可接受的误差范围。