摘要

为高效准确预测旅客选择空铁联运各中转城市的概率并揭示相关因素影响机制,基于互联网客票脱敏数据,应用随机森林算法、特征重要度和部分依赖图方法探究解释变量与中转城市备选集间的复杂作用关系.结果表明,随机森林模型可有效处理不均衡分布样本,具有更高的预测精度,总体分类准确率可达88.54%,并具备描述自变量非线性作用的能力.以京津冀城市群保定-上海的空铁联运场景为例,联运服务在运营方层面关于时间、价格、衔接效率等属性相较于旅客个人社会属性占据更高影响权重,且与中转城市选择概率间存在非线性联系,表现为Z形和S形曲线特征.该研究结果有助于空铁联运中转城市的优势市场划分,提升旅客联运服务质量.