摘要
本发明公开了一种基于深度Q网络的共享单车预测调度方法,包括步骤:1、设计用于模拟共享单车实际调度的仿真环境;2、获取用户信息并构建用户行为数据矩阵;3、训练由线性回归模型和SVM模型构成的预测网络模型;4、结合预测网络模型训练基于深度Q网络的预测调度模型;5利用训练完成的模型进行实时调度。本发明能够在缺乏足够训练数据的情况下,通过结合线性回归模型、SVM模型及深度Q网络的深度强化学习方法提前预测出未来时间段各用车区域的用车需求,从而提前对各用车区域的共享单车实施快捷、合理的调度。
- 单位