摘要
作为影响手机信令数据定位质量的关键因素,定位频率对交通方式的识别精度具有重要影响。为量化定位频率与交通方式识别精度之间的变化规律,首先,提出一种基于随机森林的交通方式识别模型;其次,在通信运营商的协助下,通过开展实地数据采集实验,完成手机信令数据及对应真实出行信息的同步采集,并利用该数据集对本文提出的交通方式识别模型进行了验证;最后,通过数据抽样形成一系列拥有不同定位频率的手机信令数据集,利用该系列数据集对不同定位频率下的交通方式识别精度进行评估研究。验证和研究结果表明:本文模型对步行、非机动车、汽车和公共交通4种交通方式的总体识别准确率为79.2%;每种交通方式对定位频率的敏感性不同,其中非机动车与公交的敏感性更高,步行和汽车的敏感性相对较低;随着平均定位频率从48s/条下降至241s/条,非机动车和公交的整体识别精度下降幅度分别约为19.2%和21.5%,而步行与汽车的整体识别精度则分别下降12.8%与11.5%;综合考虑识别准确率与计算效率两方面的需求,建议将60s/条作为用户筛选与数据抽样的最佳阈值。
-
单位重庆市交通规划研究院; 西南交通大学