奖励引导的辅助防空反导自主作战决策研究

韩兴豪; 曹志敏; 刘家祺; 李旭辉

doi:10.16426/j.cnki.jcdzdk.2021.03.006

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

奖励引导的辅助防空反导自主作战决策研究

作者：韩兴豪; 曹志敏; 刘家祺; 李旭辉

来源：舰船电子对抗, 2021, 44(03): 26-40.

DOI：10.16426/j.cnki.jcdzdk.2021.03.006

摘要

现代作战态势愈加复杂,人工智能的跨越发展为提高军事决策智能化水平提供了新思路。利用深度强化学习技术,发挥深度网络在态势特征提取方面的能力,结合强化算法对智能体决策方法的迭代与优化,实现了作战智能化。针对复杂的作战态势,提出了一种对战训练框架,为执行辅助防空反导任务的歼击机构建智能体,并利用奖励重塑的方法缓解稀疏奖励问题,探讨了全面实现军事决策智能化的道路。

单位
江苏自动化研究所

全文

访问全文

收藏分享被引(4) 浏览

更新时间：2024-04-17 13:22

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号