基于深度强化学习的无人艇轨迹跟踪算法研究

夏家伟; 朱旭芳<sup>*</sup>; 罗亚松; 吴兆东

doi:10.13245/j.hust.228371

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于深度强化学习的无人艇轨迹跟踪算法研究

作者：夏家伟; 朱旭芳^*; 罗亚松; 吴兆东

来源：华中科技大学学报(自然科学版)科技大学, 2023, 51(05): 74-80.

DOI：10.13245/j.hust.228371

摘要

针对欠驱动水面无人艇(USV)轨迹跟踪控制问题，提出一种基于近端策略优化(PPO)的深度强化学习轨迹跟踪控制算法．为引导控制器网络的正确收敛，构建基于长短时记忆(LSTM)网络层的深度强化学习控制器，设计了相应的状态空间和收益函数．为增强控制器的鲁棒性，生成轨迹任务数据集来模拟复杂的任务环境，以此作为深度强化学习控制器的训练样本输入．仿真结果表明：所提出的算法能有效收敛，具备扰动环境下的精确跟踪控制能力，有较大的实际应用潜力．

单位
电子工程学院; 中国人民解放军海军工程大学

全文

访问全文

收藏分享被引(5) 浏览

更新时间：2024-03-19 03:48

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号