摘要

深度强化学习能为交通信号控制研究带来诸多优化空间,它能够实现Agent与道路交通环境之间的交互,根据获得的惩罚或奖励不断地学习知识,从而更加适应环境。研究主要是基于深度强化学习和SUMO仿真的方法,以从仿真的方式建立的智能网联车辆环境中得到单路口交通实时动态信息,并从中输出深度Q网络(DQN)算法所需要的重要参数。基于搭建的深度神经网络,通过不断优化它的权重参数来提高性能,进一步实现对单路口交通信号控制方案的优化,并最终探索一个能够通过自主学习来高效控制单路口交通的信号控制方案。