摘要

提出了一种预测乘客在指定位置和指定时间预测打车概率和等待时间的方法。设计了一种将地图离散化,使用特征点修复GPS轨迹的解决方案,且适用于大数据问题;在修复的GPS数据基础上提出了基于经验分布在等待特征点和时间点的打车概率和等待时间模型;并基于该模型预测用户指定位置和指定时间的打车概率。另外给出了基于该模型的增量学习的方法。大规模GPS轨迹数据使用Hadoop平台实现了管理和分析计算,证明了该方案的可行性;预测结果在仿真实验中取得了良好的效果,证明了模型具有较高的准确性,同时可以期望准确性随着数据量的增大而提升;另外该模型得到的特征点和特征时间概率和等待时间的参考表并不会随着GPS轨迹数据的增大而增大,证明了模型有良好的可扩展性。