基于强化学习的波动鳍推进水下作业机器人悬停控制

马睿宸; 白雪剑; 王宇; 王睿; 王硕

doi:10.7641/CTA.2022.11054

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于强化学习的波动鳍推进水下作业机器人悬停控制

作者：马睿宸; 白雪剑; 王宇; 王睿; 王硕

来源：控制理论与应用, 2022, 39(11): 2092-2099.

DOI：10.7641/CTA.2022.11054

摘要

本文针对波动鳍推进水下作业机器人的悬停控制问题开展研究.首先,给出了波动鳍推进水下作业机器人的运动学模型、动力学模型和波动鳍的参数–力映射模型,建立了基于马尔可夫决策过程的悬停控制训练框架.其次,基于模型结构和训练策略,使用强化学习的方法进行网络训练,得到最佳的悬停控制器.最终,在室内水池中完成了波动鳍推进水下作业机器人的悬停控制实验,实验结果验证了所提方法的有效性.

单位
中国科学院大学; 中国科学院自动化研究所; 复杂系统管理与控制国家重点实验室

全文

访问全文

收藏分享被引浏览

更新时间：2024-11-28 21:05

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号