摘要
本文研究基于车联网环境设计了强化学习换道模型,首先,采用最优化建模的方法研究换道控制模型的约束条件、初始条件和目标函数。其次,面向Deep Q Learning的算法及需求,根据车辆的运动规律设计状态转移方法,将约束条件内嵌到仿真器中,根据目标函数设计回报函数,并通过试验选择Deep Q Learning种的Dueling deep network structure (DDQN)模型设计求解算法。最后,通过数值试验验证三种模型的有效性,本研究显示强化学习换道模型具有作为自动驾驶车辆换道控制模块的潜力。
-
单位宁波工程学院