摘要
本文在大量GPS轨迹数据基础之上,分别运用C4.5决策树、支持向量机和随机森林三种机器学习算法识别了交通出行方式(包括步行、自行车、公交车、小汽车和地铁),实现基于轨迹数据的出行模式识别。首先,对轨迹数据预处理,利用时空聚类算法从离散的GPS点数据中获取停驻信息,进而提取出行段数据。其次,利用时间和坐标数据计算出行段的特征参数,包括距离、时长、平均速度、速度的95分位数、速度方差、平均加速度和最大加速度。最后,通过机器学习识别出行方式,并对三种不同算法的识别精度进行了评估。结果表明:基于速度的特征参数的区分效果显著,总时长和总距离有助于非机动车与机动车的区分以及步行与自行车的区分;C4.5决策树算法的精度为73%,支持向量机算法的精度为78%,随机森林算法的分类效果最优,准确率达到了80%以上。
-
单位湖南师范大学; 湖南工程职业技术学院