基于改进柔性演员评论家算法的研究

免费注册

科研之友

微信

新浪微博

Facebook

作者：胡仕柯; 赵海军

来源：太原师范学院学报(自然科学版), 2021, 20(03): 48-52.

摘要

针对柔性演员评论家算法训练速度慢且训练过程不稳定的问题,提出了一种改进柔性演员评论家算法.通过在原有算法中引入内在好奇心机制,提高智能体探索能力与样本利用效率,并在仿真环境中用于求解倒立摆问题,实验结果表明文章算法具有更佳的收敛速度与稳定性.

更新时间：2024-04-17 14:24

科研之友科研之友机构版科创云

科研成果科研人员科研机构

帮助中心隐私政策服务条款

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号