摘要

本发明公开了一种基于近端策略优化的交通信号控制方法,包括:1建立经验存储集合,包括交叉口信号相位数据和交通流状态数据;2构建基于LSTM神经网络的信号策略网络Actor和信号价值网络Critic;3以经验存储集合中第n回合下t时刻的样本{S-(n,t),a-(n,t),r-(n,t),S-(n,t+1)}作为输入训练信号策略网络Actor和信号价值网络Critic;4将当前回合数n+1赋值给n,循环执行上述步骤,直到n=N,保存信号策略网络Actor的模型参数,用于真实场景中输出不同交通状态下的信号相位。本发明能能使得交通信号控制能够根据交通状态变化自动进行调整,从而能提高交叉口的通行效率。