多无人平台协同对抗的实时重决策方法和系统

作者:王国强; 陈宇轩; 罗贺; 蒋儒浩; 马滢滢; 胡笑旋; 夏维; 唐奕城; 靳鹏; 马华伟; 王浩丞
来源:2021-03-12, 中国, ZL202110269461.9.

摘要

本发明提供一种多无人平台协同对抗的实时重决策方法和系统,涉及无人平台领域,包括:实时获取多无人平台协同对抗时的无人平台状态数据;计算无人平台状态数据的奖励回报;基于预先构建的Actor网络对无人平台状态数据进行处理,得到当前回合的多无人平台重决策方案;基于预先构建的Critic网络对无人平台状态数据进行处理,得到重决策价值函数;基于奖励回报和重决策价值函数计算TD误差;基于TD误差更新Actor网络和Critic网络;多无人平台执行多无人平台重决策方案,得到多无人平台协同对抗数据,并作为下一回合的无人平台状态数据。本发明可以得到最适应当前环境下的无人平台重决策方案。