摘要

为实现无人驾驶船舶在未知环境中自适应航行,建立一种基于Q-Learning的无人驾驶船舶路径规划模型。应用基于马尔科夫过程的Q学习算法,分别就环境模型、动作空间、激励函数及动作选择策略4大要素建立模型,设计激励函数,规划最优策略,使得无人驾驶船舶路径规划过程中所获奖赏最大;利用python和pygame平台建立仿真环境,仿真结果表明,该方法可有效地在未知环境中规划出较优路径及成功避让多个障碍物。