驾驶行为机器人仿真环境与拥堵算法的研究

李雨松; 徐野; 哈乐<sup>*</sup>

doi:10.16661/j.cnki.1672-3791.2203-5042-0341

摘要

目的强化学习具有较强的感知能力，但是缺乏一定的决策、能力，而强化学习具有决策能力，对感知问题束手无策。因此，将两者结合起来，即为深度强化学习，优势互补，为复杂系统的感知决策问题提供了解决思路。在现实生活中，我们出行会受到多种因素的影响，人类通过多次的驾驶，驾驶水平会越来越高，机器人也是同样如此。方法该文对用户驾驶行为机器人进行研究，构建一个机器人驾驶仿真环境，伴随着拥堵情况，让机器人自己不断地去学习，如何更快、更安全到达目的地。结果在该仿真环境下，机器人通过学习，使其能够更快、更安全到达目的地。结论在设置好拥堵及仿真环境后，通过训练能够使机器人更快、更安全到达目的地。

单位
沈阳理工大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-20 10:24

驾驶行为机器人仿真环境与拥堵算法的研究

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友