摘要
本发明公开了一种非线性多智能体系统的最优一致性控制方法及系统,先根据异构多智能体系统各个体动力学特性,建立参考行为模型,采用领导者—跟随者的控制模式,形成以参考行为模型为个体组成的多智能体系统;然后根据多智能体的网络拓扑结构,构建动态图型博弈全局误差动力学模型,定义多智能体局部性能指标函数,根据全局纳什均衡,可得贝尔曼最优方程;再在仅利用智能体局部信息条件下,采用基于值函数逼近的执行—评价执行网络框架的方式,在线迭代学习获得最优一致性协议,实现各参考模型行为的一致性。本发明相对现有技术,在保证最优控制性能下,能够高效地解决复杂多智能体系统的一致性问题,更具有实际应用价值和高强的可扩展性。
- 单位