开展基于深度强化学习的无人艇集群动态博弈对抗中的协同围捕决策研究。建立受距离和相对角度影响的无人艇围捕环境模型,利用基于策略网络和双评价网络的深度强化学习方法求解围捕策略,立足协同围捕任务,基于距离和相对角度设计引导型奖励函数,避免奖励稀疏。仿真结果表明,基于深度强化学习的红方无人艇集群能够对蓝方无人艇进行有效的协同围捕。研究成果可为无人艇集群博弈对抗演练提供参考。