MuZero算法在多种棋类游戏中的表现“超越人类”

作者:编辑部
来源:机器人产业, 2019, (06): 21-25.
DOI:10.19609/j.cnki.cn10-1324/tp.2019.06.005

摘要

<正>一直以来,人工智能领域的科学家们都想构建出具备规划能力的智能体。最近,DeepMind的研究人员提出了一种称之为MuZero的算法。该算法结合了基于高性能规划和无模型强化学习算法两种方法的优点,在不具备任何底层动态知识和游戏规则的情况下,通过结合基于树的搜索和学得模型,在国际象棋、日本将棋、围棋等棋类游戏中的性能表现可媲美AlphaZero,超越人类。

全文