摘要

深度强化学习兼具深度学习对高维输入的处理能力和强化学习的决策能力,能够实现由高维的感知信息到连续动作空间输出的直接映射,非常适合处理环境复杂、交互频繁的自动驾驶任务。本文介绍了深度强化学习的主要类别以及研究进展,对自动驾驶系统关键技术进行详细剖析,重点分析了深度强化学习在自动驾驶系统环境感知、决策规划、控制执行关键技术领域的应用现状,最后展望了深度强化学习(DRL)在自动驾驶系统中的应用前景,指出研究DRL算法的可解释性提升整车功能安全等级,以及研究DRL模型的决策稳定性或利用DRL算法提升系统综合控制能力已成为未来的发展方向。