基于DE-MADDPG的多无人机协同追捕策略研究

符小卫; 王辉; 徐哲

摘要

针对多无人机协同对抗快速目标的追逃博弈问题，研究了多无人机的协同追捕策略。基于解耦多智能体深度确定性策略梯度算法DE-MADDPG（Decomposed Multi-Agent Deep Deterministic Policy Gradient）研究了多无人机协同对抗快速目标的追捕策略，设计了多无人机协同追捕的全局奖励和局部奖励两种奖励函数，训练后的多无人机能够有效地执行协同追捕任务。通过设置快速目标的多种逃逸控制策略，仿真验证了所设计的方法能够利用追捕无人机的数量优势，通过协作完成对快速目标的协同围捕，并且通过比较，验证本文所提出的算法相比MADDPG（Multi-Agent Deep Deterministic Policy Gradient）算法更快地取得了收敛效果。

单位
西北工业大学

收藏分享被引浏览

更新时间：2021-11-09 05:58

基于DE-MADDPG的多无人机协同追捕策略研究

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友