摘要

为了能够给强化学习算法提供一个虚拟的训练仿真链路环境,该文自主搭建虚拟链路仿真环境。结合现实世界中道路的天气、道路类型、拥堵、道路的限速情况等情况对用户驾驶行为的影响以及驾驶汽车时产生的动作,合理设置奖励值,使强化学习算法训练时更加契合现实。通过OPENAI gym自主搭建静态虚拟道路环境,使用DDQN算法在该虚拟静态链路进行训练,并生成曲线图,对智能体得到的奖励进行分析研究。实验结果表明,该虚拟链路环境在使用强化学习算法时,智能体得到的奖励会逐步提升,环境搭建可靠。

全文