深度确定性策略梯度和预测相结合的无人机空战决策研究

李永丰; 吕永玺<sup>*</sup>; 史静平; 李卫华

摘要

针对无人机自主空战机动决策过程中遇到的敌方不确定性操纵问题，提出了一种目标机动指令预测和深度确定性策略梯度算法相结合的无人机空战自主机动决策方法。对空战双方的态势数据进行有效的融合和处理，搭建无人机六自由度模型和机动动作库，在空战中目标通过深度Q网络算法生成相应机动动作库指令，同时我方无人机通过概率神经网络给出目标机动的预测结果。提出了一种同时考虑了两机态势信息和敌机预测结果的深度确定性策略梯度强化学习方法，使得无人机能够根据当前空战态势选择合适的机动决策。仿真结果表明，该算法可以有效利用空战态势信息和目标机动预测信息，在保证收敛性的前提下提高无人机自主空战决策强化学习算法的有效性。

单位
自动化学院; 西北工业大学

收藏分享被引浏览

更新时间：2024-03-19 03:49

深度确定性策略梯度和预测相结合的无人机空战决策研究

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友