摘要
本发明提供一种多无人平台协同对抗的实时重决策方法和系统,涉及无人平台领域,包括:实时获取多无人平台协同对抗时的无人平台状态数据;计算无人平台状态数据的奖励回报;基于预先构建的Actor网络对无人平台状态数据进行处理,得到当前回合的多无人平台重决策方案;基于预先构建的Critic网络对无人平台状态数据进行处理,得到重决策价值函数;基于奖励回报和重决策价值函数计算TD误差;基于TD误差更新Actor网络和Critic网络;多无人平台执行多无人平台重决策方案,得到多无人平台协同对抗数据,并作为下一回合的无人平台状态数据。本发明可以得到最适应当前环境下的无人平台重决策方案。
- 单位