基于强化学习的通信受限环境多无人机协同策略

程进<sup>*</sup>; 胡寒栋; 江业帆; 张一博; 丁季时雨

doi:10.19942/j.issn.2096-5915.2022.5.045

摘要

随着人工智能技术的发展，空域无人作战正由“单平台遥控”向“多平台协同”转变。多无人机协同作战任务具有非完全信息、通信受限、高实时、强动态等特点，给协同决策生成带来巨大挑战。针对通信受限环境中的多无人机协同决策问题，提出一种基于动态层级网络通信架构的通信强化学习协同策略，该策略能够显著减少无人机集群间的通信次数，同时准确传递其决策需要的信息，从而得到较优协同策略。针对多无人机协同围捕的典型任务场景，基于OpenAI平台对所提出的算法进行了仿真验证。结果表明，与传统强化学习算法相比，提出的通信强化学习策略可以显著减少无人机间的通信次数，同时在一定程度上避免潜在的信息欺骗问题。完成任务需要的平均通信次数相比于传统两两通信结构减少约77%，为实现通信受限环境中的多无人机协同任务提供技术支撑。

单位
中国航天科工集团公司

全文

访问全文

收藏分享被引(3) 浏览

更新时间：2024-03-20 13:21

基于强化学习的通信受限环境多无人机协同策略

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友