摘要

无人水面艇在动态环境下的路径规划是无人船导航的难点。在传统的Q学习算法的基础上,采用了一种新的搜索策略,该策略结合了贪婪搜索与玻尔兹曼搜索,平衡了搜索的随机性和目的性,减少了搜索陷入局部最优的可能性,同时提出了一种新的奖惩函数,综合了无人水面艇航行时导航和避障两种行为,更加符合无人水面艇实际航行环境。整个方法贴近实际情况,成功实现了水面无人艇的动态环境下路径规划。仿真模拟结果和实船航行都验证了所提出方法的有效性。

  • 单位
    中国科学技术大学; 中国科学院,合肥智能机械研究所; 中国科学院合肥智能机械研究所