为“强化学习智能体”提供性能基准

作者:Yuval Tassa
来源:机器人产业, 2018, (01): 34-38.
DOI:10.19609/j.cnki.cn10-1324/tp.2018.01.006

摘要

<正>AlphaGo的横空出世让我们看到了强化学习在围棋领域的出色应用。目前DeepMind推出一款名为"DeepMind Control Suite"的控制套件,该控制套件旨在帮助我们利用强化学习技术实现对物理实体的操控,并且

全文