基于深度强化学习的多智能体编队协同控制

文永明; 李博研; 张宁宁; 李小建; 熊楚依; 刘洁玺

doi:10.15908/j.cnki.cist.2023.05.012

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于深度强化学习的多智能体编队协同控制

作者：文永明; 李博研; 张宁宁; 李小建; 熊楚依; 刘洁玺

来源：指挥信息系统与技术, 2023, 14(05): 75-79.

DOI：10.15908/j.cnki.cist.2023.05.012

摘要

采用深度强化学习算法解决了多智能体编队协同控制问题。基于多智能体深度确定性策略梯度算法（MADDPG）构建分布式编队控制架构，并结合集中式训练-分布式执行框架进行求解。针对多智能体环境不稳定问题，依据单个智能体的局部信息构建对应奖励函数。针对大规模编队协同控制，实现了多个多智能体环境下的算法训练与评估。试验结果表明，应用该算法的多智能体能够完成协同任务，且所有智能体都可得到合理的协同控制策略。

单位
北京控制与电子技术研究所

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-19 06:53

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号