摘要
在移动机器人路径规划研究中,传统的强化学习方法缺乏环境的先验知识,需要不断地探索才可以规划出最优路径,这使得算法需要大量的时间才能收敛.为了提高算法的收敛速度,本文提出了一种第一阶段基于探索规则积累路径先验知识、第二阶段基于Q-learning算法和知识共享机制优化路径的单智能体路径规划方法,适用于求解栅格环境下的路径规划任务.不同环境下的仿真结果证明,相比于现有的方法,该算法不仅能够规划出最优路径,而且在时间效率上提升了39.7%,有效提高了机器人路径规划的效率.
-
单位材料学院; 五邑大学; 深圳市人工智能与机器人研究院