基于深度强化学习的无人机空中目标自主跟踪

作者:杨兴昊; 宋建梅; 佘浩平*; 吴程杰; 杨钦宁; 付伟达
来源:计算机测量与控制, 2022, 30(10): 88-102.
DOI:10.16526/j.cnki.11-4762/tp.2022.10.015

摘要

针对空中对接任务中的目标自主跟踪问题,提出了一种基于深度强化学习的端到端的目标跟踪方法;该方法采用近端策略优化算法,Actor网络与Critic网络共享前两层的网络参数,将无人机所拍摄图像作为卷积神经网络的输入,通过策略网络控制多旋翼无人机电机转速,实现端到端的目标跟踪,同时采用shaping方法以加速智能体训练;通过物理引擎Pybullet搭建仿真环境并进行训练验证,仿真结果表明该方法能够达到设定的目标跟踪要求,且具有较好的鲁棒性。

全文