本发明涉及运动目标检测检测技术,特别是深度逆强化学习的无人机航拍视频中的目标检测方法,其特征是:至少包括如下步骤:步骤1、建立深度逆强化学习模型;步骤2、模型策略迭代与算法实现;步骤3、模型关键参数选取与优化;步骤4、输出运动小目标检测结果。它提供一种能解决复杂任务、奖励回报延迟的深度逆强化学习的无人机航拍视频中的目标跟踪方法。