摘要

针对典型的飞行器制导任务,利用深度学习算法可以有效地拟合导弹飞行状态与制导指令之间的函数关系。然而当制导任务发生变化时,其二者之间的映射关系也会随之改变,从而导致在当前环境下预训练好的模型无法直接作用于新环境,重新训练制导模型需要大量的弹道数据和巨额的时间成本。为解决上述问题,基于迁移学习的思想引入域对抗神经网络,提出基于迁移学习的多任务制导算法。以一个含有大量标签数据的源域任务辅助两个含有极少量标签数据的目标域任务进行迁移学习,从而克服预训练与在线控制之间的环境差异。使用特征提取器和域判别器提取出对任务环境不敏感的关键特征,使神经网络学习到各个任务所共享的底层信息;为提高预测精度,分别设计针对不同任务的偏置加速度预测器。数值仿真结果表明,基于迁移学习的多任务制导算法实现了导弹在不同任务中的加速度指令预测。