基于Policy Gradient的自动驾驶仪控制参数设计

柳絮润; 姚文杰

doi:10.14016/j.cnki.1001-9227.2021.02.001

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于Policy Gradient的自动驾驶仪控制参数设计

作者：柳絮润; 姚文杰

来源：自动化与仪器仪表, 2021, (02): 1-4.

DOI：10.14016/j.cnki.1001-9227.2021.02.001

摘要

针对目前工程上通过在弹道上选取特征点,利用系数冻结法去研究和设计,这样一系列的假设会使设计的导弹模型与实际的弹体模型存在一定的差异,因此,提出了基于强化学习的过载自动驾驶仪在线调整PID参数,研究飞行器的控制问题,该方法将导弹作为智能体,读取飞行状态信息并建立动作策略和奖惩机制;其次,智能体根据算法给出的随机动作指令执行,执行完动作之后反馈状态信息,算法根据反馈的状态信息给出新动作。最终,通过多回合训练实现了过载指令的跟踪,证明了该方法的有效性。

单位
南京理工大学; 自动化学院

全文

访问全文

收藏分享被引浏览

更新时间：2024-04-17 13:11

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号