摘要

针对基于最长队列优先配时算法的大规模交通信号灯协同控制模式存在的诸多不足,提出了一种基于多智能体深度强化学习的大规模交通信号灯控制模型。首先形成融合经验学习集和实践应用集的高度动态复杂路段交通运行态势经验池;然后利用深度长短期神经网络建立时间正序下的大规模交通信号灯与多智能体之间的物理映射关系;最后利用深度确定性策略梯度算法实现复杂路段大规模交通信号灯最优协同控制。对模型开展了典型需求场景下的仿真验证及应用实践定量分析,验证分析结果表明模型可以大幅度改善高度动态复杂路段交通疏导的效率,正常交通流下复杂路段交通疏导平均等待时间降低27.82%,正常交通流下复杂路段交通疏导平均队列长度降低31.19%。