摘要

基于乘客上下车刷卡交易记录,结合站点信息,有助于精准分析客流时空分布,为公交运营部门的调度决策提供参考。本文以北京市公交1路车为研究对象,针对公交客流在时间和站点上的多峰值分布特性,建立二维高斯混合模型描述客流分布,依据BIC准则确定聚类中心数K的值,选用EM算法对模型迭代求解。利用Python完成数据处理,结果表明,当K值取6时,对应模型的BIC值为300130.89,似然函数值为-149913.41,模型取得了较好的拟合效果,对分析客流时空分布和优化公交运营调度有较高的参考价值。