摘要

水质监测无人船对问题水域进行监测时,由于地形或天气原因使工作人员无法在视野中对水质监测无人船实时操作,需要USV的自主路径规划到指定水位进行检测。针对以上问题,本文提出利用无人船在未知水域中获得障碍物的分布信息,通过用Q学习算法对数据训练以规划路径,再利用BP神经网络的反馈进行权值的调整得到奖励值R,反馈给Q学习算法进行Q值迭代,其过程中选择不同的动作方向使Q值达到最优,从而使路径达到最优。最后通过实验仿真验证了该算法收敛速度更快,有效地提高路径规划效率,证明了该无人船路径规划算法的可行性。