基于安全强化学习的多智能体覆盖路径规划

李松; 麻壮壮; 张蕴霖; 邵晋梁<sup>*</sup>

摘要

覆盖路径规划的目的是为智能体找到一条安全的轨迹，其不仅可以有效覆盖任务区域，而且可以避开障碍物与邻近智能体。在执行覆盖任务时，复杂的大面积任务区域总是不可避免的。如何在保证智能体安全的前提下加强智能体之间的协同合作，以改善集群任务效率低、能力不足的缺点是值得探索的问题。为此，利用栅格地图建立离散的覆盖路径规划数学模型，提出一种基于值分解网络的安全多智能体强化学习算法，并通过理论证明论证其合理性。该算法通过分解群体价值函数以避免智能体的虚假奖励，有助于加强智能体之间协同覆盖策略的学习，以提高算法的收敛速度。通过在训练过程中引入屏蔽器以修正智能体的出界和碰撞等行为，保证智能体在整个任务过程中的安全。仿真和半实物实验结果表明，新算法不仅可以保证智能体的覆盖效率，同时还能有效维护智能体的安全。

单位
深圳市人工智能与机器人研究院; 电子科技大学

收藏分享被引浏览

更新时间：2024-03-19 05:15

基于安全强化学习的多智能体覆盖路径规划

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友