多无人机协同对抗决策的强化学习方法

作者:王国强; 陈宇轩; 罗贺; 马滢滢; 蒋儒浩; 胡笑旋; 唐奕城; 靳鹏; 马华伟; 夏维
来源:2021-03-12, 中国, ZL202110269453.4.

摘要

本发明提供一种多无人机协同对抗决策的强化学习方法,涉及无人机领域,包括:获取无人机初始状态数据并进行格式转换;对无人机初始状态数据进行数据补全处理;对数据补全后的无人机初始状态数据进行数据转换和归一化处理,得到无人机状态数据;基于预设的Actor-Critic算法对无人机状态数据进行处理,得到当前回合的多无人机协同对抗重决策结果;将多无人机协同对抗重决策结果输入到预设的仿真场景中,多无人机基于多无人机协同对抗重决策结果进行对抗,得到多无人机协同对抗数据,并将多无人机协同对抗数据作为下一回合的无人机初始状态数据,以得到下一回合的多无人机协同对抗重决策结果。本发明可以得到最适应当前环境下的无人机重决策方案。