摘要

现有的有轨电车信号优先控制系统存在诸多问题,如无法适应实时交通变化、优化求解较为复杂等.本文提出了一种基于深度强化学习的有轨电车信号优先控制策略.不依赖于交叉口复杂交通建模,采用实时交通信息作为输入,在有轨电车整个通行过程中连续动态调整交通信号.协同考虑有轨电车与社会车辆的通行需求,在尽量保证有轨电车无需停车的同时,降低社会车辆的通行延误.采用深度Q网络算法进行问题求解,并利用竞争架构、双Q网络和加权样本池改善学习性能.基于SUMO的实验表明,该模型能够有效地协同提高有轨电车与社会车辆的通行效率.

全文