摘要

目前虚拟环境中的无人驾驶车辆运动行为的智能训练主要通过无人驾驶车辆和环境的不断交互完成强化学习决策任务,存在无人驾驶车辆训练速度较慢且效率低下的问题.针对此问题,本文将车辆运动模拟技术和CMA-ES算法结合,提出了一种虚拟环境中基于改进协方差自适应算法(Covariance Matrix Adaptive Evolutionary Strategy, CMA-ES)算法的无人驾驶车辆运动行为智能训练方法,首先模拟车辆的运动行为,得到特殊路段的运动行为和环境信息数据;然后对模拟得到的环境信息数据进行编码预处理、分组;最后拟合无人驾驶车辆运动行为策略神经网络的权重参数,实现对场景的预学习,利用车辆运动模拟技术模拟车辆在复杂路段的运动行为作为相关经验,指导无人驾驶车辆运动行为强化学习的过程,实验表明该方法加快了无人驾驶车辆运动行为的训练速度.

全文