摘要
提出一种基于神经网络的强化学习算法,并成功的解决复杂环境下服务机器人的路径规划问题。相较于传统的路劲规划算法,该算法解决未知环境下Q学习的状态空间到动作空间的非线性映射问题,加快算法的收敛速度。仿真结果表明,在未知环境下,机器人能够选择合适的行为,完成从起始点到目标点的无碰撞导航任务,说明该算法的避障能力好、自适应能力强、收敛速度快的特点。
- 单位
提出一种基于神经网络的强化学习算法,并成功的解决复杂环境下服务机器人的路径规划问题。相较于传统的路劲规划算法,该算法解决未知环境下Q学习的状态空间到动作空间的非线性映射问题,加快算法的收敛速度。仿真结果表明,在未知环境下,机器人能够选择合适的行为,完成从起始点到目标点的无碰撞导航任务,说明该算法的避障能力好、自适应能力强、收敛速度快的特点。