基于强化学习的无人驾驶车辆行为决策方法研究进展

张佳鹏; 李琳; 朱叶

doi:10.16180/j.cnki.issn1007-7820.2021.05.012

摘要

行为决策系统能够综合环境及自车信息,使自动驾驶车辆产生安全合理的驾驶行为,是实现无人驾驶的核心。强化学习算法采用一种自监督学习的方式,使自动驾驶车辆的决策系统在与环境的交互过程中,通过不断改进自身策略自主学习到最优的决策模型,为构建有效的决策系统提供了方向。文中总结了近年来基于强化学习的行为决策方法在提高决策精度、提高决策广度以及应对不确定因素等方面的研究进展。决策精度的提升主要依赖于引入具有强大表征能力的深度学习技术。决策广度的提升得益于能够通过任务分解以缓解维数灾难的分层抽象技术。不确定因素则通过部分可观测马尔科夫决策过程被纳入考量之中以提高行车安全。

单位
上海理工大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-04-17 14:37

基于强化学习的无人驾驶车辆行为决策方法研究进展

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友