摘要
针对水下滑翔机路径规划问题,提出了一种基于Q学习的水下滑翔机路径规划方法;考虑到水下滑翔机在执行一些特定任务时会提前给定俯仰角及深度参数,且航向角选择范围通常是几个离散角度值,文章针对典型的几种俯仰角情况分别设计了航向动作选择集,这避免了Q学习方法“维数爆炸”问题;根据水下滑翔机航程最短的目标和障碍物外部约束条件,设计了奖励函数与动作选择策略;相较于传统路径规划方法,文章提出的方法不需要提前知道环境信息,而是在学习过程中根据环境的反馈选择最优动作,因此该方法在不同的环境条件下有优良的迁移能力;仿真结果表明,该方法能在未知环境中为水下滑翔机规划出规避障碍且航程短的路径。
- 单位