多无人机协同对抗决策的强化学习方法

王国强; 陈宇轩; 罗贺; 马滢滢; 蒋儒浩; 胡笑旋; 唐奕城; 靳鹏; 马华伟; 夏维

摘要

本发明提供一种多无人机协同对抗决策的强化学习方法,涉及无人机领域,包括：获取无人机初始状态数据并进行格式转换；对无人机初始状态数据进行数据补全处理；对数据补全后的无人机初始状态数据进行数据转换和归一化处理,得到无人机状态数据；基于预设的Actor-Critic算法对无人机状态数据进行处理,得到当前回合的多无人机协同对抗重决策结果；将多无人机协同对抗重决策结果输入到预设的仿真场景中,多无人机基于多无人机协同对抗重决策结果进行对抗,得到多无人机协同对抗数据,并将多无人机协同对抗数据作为下一回合的无人机初始状态数据,以得到下一回合的多无人机协同对抗重决策结果。本发明可以得到最适应当前环境下的无人机重决策方案。

单位
合肥工业大学

收藏分享被引浏览

更新时间：2024-11-29 00:02

多无人机协同对抗决策的强化学习方法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友