摘要

移动机器人是完成救援、运输等各种任务的重要工具,如何让机器人系统自主适应不同的复杂场景是目前的研究热点。本文针对具有静态和动态障碍物的复杂未知环境,对移动机器人进行运动学建模,提出了基于长短期记忆网络的近端策略优化避障算法。在无障碍物和有障碍物的仿真训练环境中,实现无先验地图信息情况下机器人在非结构化环境中的自主避障。仿真和实验结果表明,本文所提算法能够有效使机器人避开静态及动态障碍物,性能高于D3QN算法、PPO算法,解决了深度强化学习算法在训练机器人避障时收敛速度较慢的问题。