摘要
当前广泛应用的基于车流动力学建模的交通信号优化模型精确度较高但迁移能力稍弱,针对该问题,本文提出了一种基于深度强化学习的单智能体交通信号控制方法。该方法首次在考虑交叉口有行人穿越干扰的情况下定义了动作空间,从三个不同的角度定义了三种奖励函数,并提出了一种累积延迟近似方法。在算法方面,提出了一种基于动态权重的Soft Actor-Critic算法,该算法可以动态调整Actor网络和Critic网络的更新幅度,显著地提高了传统Soft Actor-Critic算法的收敛效率和收敛性能。仿真结果表明,本文提出的模型和算法在降低车辆延迟时间、减少车辆停车次数以及减少车辆队列长度等交通性能指标方面是有效的。
-
单位西安交通大学; 机械制造系统工程国家重点实验室; 太原工业学院