基于强化学习的异构多智能体系统最优输出调节

熊春萍; 马倩<sup>*</sup>

摘要

本文研究了异构多智能体系统的最优输出调节问题.通信网络拓扑含有向生成树.首先,设计了外部系统状态补偿器和状态反馈控制器,应用图论和Lyapunov稳定性理论证明了所设计的补偿器和控制器可以解决一般输出调节问题.然后,通过最小化预定义的成本方程,解决最优输出调节问题.结合最优控制理论和强化学习技术,提出了两种求解最优控制器的算法,即基于模型的策略迭代算法和无模型off-policy算法.利用无模型算法获取最优控制器的过程既不需要求解输出调节方程也不需要使用系统动态信息.最后,通过数值仿真验证了本文所提出的算法的有效性.

单位
自动化学院; 南京理工大学

收藏分享被引浏览

更新时间：2024-01-09 20:33

基于强化学习的异构多智能体系统最优输出调节

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友