摘要
针对多无人机协同执行任务过程中可能与静态障碍物和其他无人机碰撞的问题,提出了一种基于深度强化学习的协同防撞策略。首先,将每个无人机看作一个独立的决策个体,并应用深度神经网络拟合其策略函数和价值函数。然后,在独立近端策略优化算法的基础上,提出了一种只观测部分目标信息并排序的观测空间设计方法。解决了神经网络输入维度过大时难以训练的问题。最后,以25架无人机协同执行任务过程中的防撞问题为例进行了算法设计和网络结构设计,并通过仿真实验验证了所提出防撞策略的有效性。
-
单位中国航空工业集团公司沈阳飞机设计研究所; 沈阳航空航天大学