速度协调的Q学习模型研究

作者:刘元元; 卢守峰; 刘肖亮; 朱婷婷
来源:交通科学与工程, 2021, 37(02): 98-104.
DOI:10.16544/j.cnki.cn43-1494/u.2021.02.015

摘要

为平滑高速公路瓶颈区域上、下游车流速度,基于单位距离速度变化量和多项式SG卷积平滑处理的2个奖励函数,分别建立了2个速度协调的Q学习模型。利用Excel-VBA、VISSIM和MATLAB的集成仿真平台,对奖励函数的性能进行了仿真分析。研究结果表明:基于SG卷积平滑的奖励函数,可以有效地缓解瓶颈上游"走走停停"的现象,减小速度的波动幅度。速度协调的Q学习模型可以根据交通状态实时选择最优的运行速度。

全文