模仿学习算法的研究与实现

张羽萌; 季晓君

doi:10.15966/j.cnki.dnydx.2023.05.020

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

模仿学习算法的研究与实现

作者：张羽萌; 季晓君

来源：电脑与电信, 2023, (05): 38-44.

DOI：10.15966/j.cnki.dnydx.2023.05.020

摘要

为优化强化学习因为奖励函数不明确造成极大误差的弊端，深入研究并实现了模仿学习算法中的行为克隆算法和数据聚合算法。通过活动图对算法流程建模，通过类图对各类之间的关系建模，通过顺序图对核心交互流程建模。根据实验结果，比较行为克隆算法和数据聚合算法的优缺点，发现行为克隆算法可以离线训练避免真实环境的交互，但会使错误累加导致结果误差；数据聚合算法必须在线与环境交互，根据策略选择观测值对应状态，解决误差累积的问题。

单位
南京理工大学紫金学院

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-18 13:26

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号