基于知识的深度强化学习研究综述

李晨溪; 曹雷; 张永亮; 陈希亮; 周宇欢; 段理文

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于知识的深度强化学习研究综述

作者：李晨溪; 曹雷; 张永亮; 陈希亮; 周宇欢; 段理文

来源：系统工程与电子技术, 2017, 39(11): 2603-2613.

摘要

作为解决序贯决策的机器学习方法,强化学习采取持续的"交互-试错"机制,实现智能体(Agent)与环境的不断交互,从而学得完成任务的最优策略,契合了人类提升智能的行为决策方式。知识作为一种包含了经验、价值观、认知规律以及专家见解等要素的结构化信息,应用于强化学习可以有效提高Agent的学习效率,降低学习难度。鉴于此,本文以强化学习的基本理论为起点,对深度强化学习以及基于知识的深度强化学习研究成果进行了系统性的总结与梳理。

单位
浙江大学; 解放军理工大学

收藏分享被引浏览

更新时间：2024-05-23 17:18

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号