摘要

本发明一种基于深度强化学习DQN的多AGV路径规划避障方法,其包括以下步骤:根据激光雷达点云数据构建周围环境地图,并将其转换为栅格地图;根据栅格地图信息构建AGV的观察矩阵和状态向量,观察矩阵记录AGV周围是否存在其他AGV且这些AGV的运行方向;构建针对单AGV的多起点多终点路径规划模型;将构建的模型应用在环境中所有AGV上,计算出每个AGV在不考虑其他AGV的情况下的预动作,依据AGV观测范围内其他AGV的预动作得到观测矩阵,利用观测矩阵对模型结果进行修正。相较于其他启发式算法或利用深度强化学习的方法构建多AGV路径规划的方法相比,本发明能够保证AGV在躲避碰撞的同时保持最优的动作选择。