基于指导轨迹加速的机械臂强化学习运动规划

刘哲; 潘爱强; 魏本刚; 江安烽; 张家维; 白成超

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于指导轨迹加速的机械臂强化学习运动规划

作者：刘哲; 潘爱强; 魏本刚; 江安烽; 张家维; 白成超

来源：电气自动化, 2022, 44(05): 102-107.

摘要

针对深度强化学习运动规划器训练速度慢的问题，基于软动作-评论家强化学习算法，研究了指导轨迹和奖励函数设计对运动规划成功率和收敛速度的影响。结果表明，在密集奖励函数的情况下，指导轨迹加快了训练速度，但对成功率的影响较小，在稀疏奖励的情况下只有使用指导轨迹才可以收敛。试验验证密集奖励函数和指导轨迹对强化学习运动规划器的训练效果提升起了重要作用。

单位
航天学院; 哈尔滨工业大学; 国网上海市电力公司电力科学研究院

收藏分享被引浏览

更新时间：2024-03-19 14:00

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号