摘要
为提高车辆自主跟驰功能的个性化程度,使之能适应不同驾驶员的驾驶风格,提高乘员对自动驾驶功能的接受度,提出了一种基于深度强化学习的个性化跟驰控制策略.首先基于模拟驾驶试验平台进行驾驶员在环试验,获取真实驾驶员跟驰数据.根据车辆跟驰动力学,建立了连续动作空间决策模型.构建了基于Actor-Critic的深度强化学习架构,并综合考虑跟驰过程的安全性、舒适性和宜人性设计了奖励函数,通过双延迟深度确定性策略梯度(Twin Delayed Deep Deterministic Policy Gradient, TD3)对决策模型进行训练.基于CARLA模拟器的仿真结果表明,本研究提出的个性化跟驰控制策略在保证车辆自主跟驰过程稳定性和安全性的前提下,其决策结果更接近驾驶员驾驶习性.
- 单位