复杂动态环境下基于深度强化学习的AGV避障方法

蔡泽; 胡耀光<sup>*</sup>; 闻敬谦; 张立祥

doi:10.13196/j.cims.2023.01.020

摘要

为提升自动导引车(AGV)在智能工厂复杂动态环境下的避障能力，使其能在全局路径引导下安全、高效地完成避障任务，提出一种基于深度强化学习的局部避障方法。首先，将避障问题表示为部分观测马尔可夫决策过程，详细描述了观测空间、动作空间、奖励函数和最优避障策略，通过设置不同的奖励实现以全局路径引导局部避障规划；然后，在此基础上，采用深度确定性策略梯度算法训练避障策略；最后，建立了仿真实验环境，并设计多种实验场景来验证所提方法的有效性。实验结果表明，所提方法可以应对复杂动态环境，减小避障时间与距离，提高运行效率。

单位
北京理工大学

全文

访问全文

收藏分享被引(10) 浏览

更新时间：2024-03-18 12:11

复杂动态环境下基于深度强化学习的AGV避障方法

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友