摘要

目的 强化学习具有较强的感知能力,但是缺乏一定的决策、能力,而强化学习具有决策能力,对感知问题束手无策。因此,将两者结合起来,即为深度强化学习,优势互补,为复杂系统的感知决策问题提供了解决思路。在现实生活中,我们出行会受到多种因素的影响,人类通过多次的驾驶,驾驶水平会越来越高,机器人也是同样如此。方法 该文对用户驾驶行为机器人进行研究,构建一个机器人驾驶仿真环境,伴随着拥堵情况,让机器人自己不断地去学习,如何更快、更安全到达目的地。结果 在该仿真环境下,机器人通过学习,使其能够更快、更安全到达目的地。结论 在设置好拥堵及仿真环境后,通过训练能够使机器人更快、更安全到达目的地。

全文