基于APF-LSTM-DDPG算法的移动机器人局部路径规划

作者:李永迪; 李彩虹*; 张耀玉; 张国胜; 周瑞红; 梁振英
来源:山东理工大学学报(自然科学版), 2024, 38(01): 33-41.
DOI:10.13367/j.cnki.sdgc.2024.01.007

摘要

针对深度强化学习算法存在训练时间长、收敛速度慢的问题,将深度确定性策略梯度(deep deterministic policy gradient, DDPG)算法和人工势场(artifical potential field, APF)法相融合,引入长短期记忆(long short-term memory, LSTM)神经网络结构,提出了APF-LSTM-DDPG算法。首先在DDPG算法中添加LSTM,通过记忆单元和遗忘单元将奖励较高的样本优先学习,使模型更快地收敛;其次引入人工势场法,设计相应势场函数,解决环境奖励稀疏的缺点,加速模型收敛进程;然后通过人工势场法修正算法的动作选择,缩短路径长度;最后在机器人仿真平台(robot operating system, ROS)中搭建不同障碍物环境对算法进行了仿真验证。仿真结果表明,APF-LSTM-DDPG算法在搭建的仿真环境中训练时平均奖励能够更快地稳定,提高了算法的成功率并减少了规划路径中的冗余。

全文