Q-learning强化学习协同拦截制导律

王金强; 苏日新; 刘莉; 刘玉祥; 龙永松

doi:10.19306/j.cnki.2095-8110.2022.05.009

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

Q-learning强化学习协同拦截制导律

作者：王金强; 苏日新; 刘莉; 刘玉祥; 龙永松

来源：导航定位与授时, 2022, 9(05): 84-90.

DOI：10.19306/j.cnki.2095-8110.2022.05.009

摘要

为实现多枚导弹协同拦截机动目标，提升拦截效能，提出了一种Q-learning强化学习协同拦截制导律。首先，基于逃逸域覆盖理论，建立了非线性多弹协同拦截模型。其次，以视线角速率为状态，依据脱靶量构造奖励函数，通过离线训练生成强化学习智能体，并结合传统比例制导控制方法，构建基于强化学习的变导引系数制导律，实时生成实现协同拦截的制导指令。最终，通过数值仿真验证了所提算法的有效性和优越性。

单位
江南机电设计研究所

全文

访问全文

收藏分享被引(1) 浏览

更新时间：2024-03-20 22:17

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号