基于多智能体协同强化学习的多目标追踪方法

作者:王毅然; 经小川; 贾福凯; 孙宇健; 佟轶
来源:计算机工程, 2020, 46(11): 90-96.
DOI:10.19678/j.issn.1000-3428.0055904

摘要

针对现有多目标追踪方法通常存在学习速度慢、追踪效率低及协同追踪策略设计困难等问题,提出一种改进的多目标追踪方法。基于追踪智能体和目标智能体数量及其环境信息建立任务分配模型,运用匈牙利算法根据距离效益矩阵对其进行求解得到多个追踪智能体的任务分配情况,并以缩短目标智能体的追踪路径为优化目标进行任务分工,同时利用多智能体协同强化学习算法使多个智能体在相同环境中不断重复执行探索-积累-学习-决策过程,最终根据经验数据更新策略完成多目标追踪任务。仿真结果表明,与DDPG和MADDPG方法相比,该方法能在避免碰撞和躲避障碍物的情况下,使多个智能体通过相互协作形成针对多个运动目标的最短追踪路线。