摘要
为提升自动导引车在智能工厂复杂动态环境下的避障能力,使其能在全局路径引导下安全、高效的完成避障任务,提出一种基于深度强化学习的局部避障方法。首先,将避障问题表示为部分观测马尔可夫决策过程,详细描述了观测空间、动作空间、奖励函数和最优避障策略,通过设置不同的奖励实现以全局路径引导局部避障规划;在此基础上,采用深度确定性策略梯度算法训练避障策略;最后,建立了仿真实验环境,设计多种实验场景验证方法的有效性。实验结果表明,提出的方法可以应对复杂动态环境,减小避障时间与距离,提高运行效率。
- 单位