基于深度强化学习DQN的多AGV路径规划避障方法

黄岩松; 姚锡凡

摘要

本发明一种基于深度强化学习DQN的多AGV路径规划避障方法,其包括以下步骤：根据激光雷达点云数据构建周围环境地图,并将其转换为栅格地图；根据栅格地图信息构建AGV的观察矩阵和状态向量,观察矩阵记录AGV周围是否存在其他AGV且这些AGV的运行方向；构建针对单AGV的多起点多终点路径规划模型；将构建的模型应用在环境中所有AGV上,计算出每个AGV在不考虑其他AGV的情况下的预动作,依据AGV观测范围内其他AGV的预动作得到观测矩阵,利用观测矩阵对模型结果进行修正。相较于其他启发式算法或利用深度强化学习的方法构建多AGV路径规划的方法相比,本发明能够保证AGV在躲避碰撞的同时保持最优的动作选择。

单位
华南理工大学

收藏分享被引浏览

更新时间：2024-11-28 23:38

基于深度强化学习DQN的多AGV路径规划避障方法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友