基于深度强化学习的多无人机协同防撞策略研究

霍琳; 李诗琪<sup>*</sup>; 费思邈; 齐奂超; 胡正宇

摘要

针对多无人机协同执行任务过程中可能与静态障碍物和其他无人机碰撞的问题，提出了一种基于深度强化学习的协同防撞策略。首先，将每个无人机看作一个独立的决策个体，并应用深度神经网络拟合其策略函数和价值函数。然后，在独立近端策略优化算法的基础上，提出了一种只观测部分目标信息并排序的观测空间设计方法。解决了神经网络输入维度过大时难以训练的问题。最后，以25架无人机协同执行任务过程中的防撞问题为例进行了算法设计和网络结构设计，并通过仿真实验验证了所提出防撞策略的有效性。

单位
中国航空工业集团公司沈阳飞机设计研究所; 沈阳航空航天大学

收藏分享被引浏览

更新时间：2024-03-15 17:04

基于深度强化学习的多无人机协同防撞策略研究

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友