基于改进强化学习的无人艇集群一致性控制

曹诗杰; 陈于涛<sup>*</sup>; 曾凡明

doi:10.13245/j.hust.190908

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于改进强化学习的无人艇集群一致性控制

作者：曹诗杰; 陈于涛^*; 曾凡明

来源：华中科技大学学报(自然科学版)科技大学, 2019, 47(09): 42-47.

DOI：10.13245/j.hust.190908

摘要

针对传统的建模研究方法在应用于无人水面艇集群时会遇到复杂的动态海洋环境问题,提出了一种新的多智能体马尔可夫决策过程控制框架,将一致性控制和势博弈理论结合起来.在强化学习过程中,通过映射每个智能体的动作-价值函数值(Q值)表到全局最大势函数表,从而得到最优联合决策矩阵用于协同控制.进行了仿真试验,根据平均回报值给出了分析结果,验证了控制器决策矩阵的自优化性,以及对于较大环境扰动的自适应性.

单位
中国人民解放军海军工程大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-04-10 20:50

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号