基于优化强化学习的多智能体编队最优控制

张海峰<sup>*</sup>; 简燕红; 王宏刚; 崔琪

doi:10.14107/j.cnki.kzgc.20200656

摘要

针对一类非线性多智能体系统的编队控制问题，设计了基于优化强化学习的最优控制策略。首先，通过设计分布式多智能体性能指标函数获得了多智能体的分布式哈密顿-雅可比-贝尔曼(HJB)方程。利用优化强化学习的方法来求解HJB方程，从而获得最优控制策略，其中评价网络和执行网络分别用于逼近系统的性能指标函数和最优控制策略。与传统强化学习方法相比，所提方法避免了通过基于HJB方程估计误差平方的梯度下降法来获得神经网络的权重更新律的过程，从而简化了控制器设计。然后，通过李雅普诺夫理论证明了闭环控制系统的稳定性。最后，通过仿真实验验证了所提控制方法的有效性。

单位
国家电网有限公司

全文

访问全文

收藏分享被引(5) 浏览

更新时间：2024-03-20 21:12

基于优化强化学习的多智能体编队最优控制

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友