最新无模型深度强化学习研究:从零开始训练机器人&ldquo;玩乐高&rdquo;

免费注册

科研之友

微信

新浪微博

Facebook

作者：Tuomas Haarnoja; Vitchyr Pong; Aurick Zhou; Murtaza Dalal; Pieter Abbeel; Sergey Levine

来源：机器人产业, 2018, (03): 48-51.

DOI：10.19609/j.cnki.cn10-1324/tp.2018.03.008

摘要

伯克利最新提出无模型深度强化学习方法——soft Q-learning(SQL)算法,该算法可以对模拟和现实世界的任务执行组合性,同时在该算法基础上提出了一种使用具有表达性的神经网络策略学习机器人操作技能的学习框架。

访问全文

更新时间：2024-04-25 03:08

科研之友科研之友机构版科创云

科研成果科研人员科研机构

帮助中心隐私政策服务条款

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号