摘要
针对强化学习算法收敛速度慢,易产生"维度灾难"的问题提出一种深度学习与强化学习相结合的算法,用于解决六足森林消防机器人的路径规划问题。采用Python方法建立二维网格地图,对复杂的环境进行模拟,减小建模的复杂性,在相同的条件下,分别对强化学习和深度强化学习算法进行仿真研究。对比仿真结果表明,深度强化学习算法下机器人到达目标点所需步长随迭代次数而减少,能使学习效率得到显著的提高,可以说明算法的收敛速度更快。
-
单位电子工程学院; 南京林业大学