针对飞行器传统增益调参法依赖于人工经验繁琐费时、难以实现参数自整定的缺点,提出了利用强化学习中的深度Q网络算法与飞行环境状态的交互不断学习,实现对控制增益的自动调整动作。训练结果表明,该方法使高速飞行器能够自适应调整控制增益,稳定跟踪攻角指令,节省了人工调参步骤及时间,有效提高了控制系统自适应性。