基于深度强化学习潜艇攻防对抗训练指挥决策研究

郭洪宇; 初阳; 刘志; 周玉芳

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于深度强化学习潜艇攻防对抗训练指挥决策研究

作者：郭洪宇; 初阳; 刘志; 周玉芳

来源：指挥控制与仿真, 2022, 44(01): 103-111.

摘要

潜艇和水面舰艇编队间的攻防对抗是潜艇作战研究的重点内容,如何确保潜艇在舰艇编队、反潜直升机等兵力的联合封锁下存活和突围,是对潜艇指挥决策的考验。为此,针对潜舰机博弈对抗场景,从深度强化学习和规则推理两个方面构建潜艇智能体,提出两种近端策略优化(Proximal Policy Optimization, PPO)算法改进机制,开展互博弈对抗和分布式训练,最终实现潜艇在对抗过程中的智能决策,相关技术路线和算法在兵棋对战平台上得到实施和验证,算法改进后的收敛速度和稳定性有了较大提升,可为潜艇智能指挥决策的研究提供技术参考。

单位
江苏自动化研究所

收藏分享被引(1) 浏览

更新时间：2024-03-19 16:24

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号