摘要
针对目前交叉口信号灯的控制方法无法有效的应对实时变化的交通状态。该算法提出多指标优化的深度强化学习单交叉口信号控制,以共同优化多指标来定义奖惩函数,动作的选择策略为贪心策略,其中探索率以固定的频率进行余弦衰减,在足够多的探索未知动作的基础上也保证了更好的收敛结果,最后使用SUMO仿真平台对该算法的控制效果进行验证。结果表明,该算法相比固定配时方案和感应控制方案,能够更有效的降低交叉口车辆的延误时间、排队长度、停车次数3项指标,具有更好的适用性跟有效性。
-
单位电子信息工程学院; 西安工业大学