AlphaZero原理与启示

唐川; 陶业荣<sup>*</sup>; 麻曰亮

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

AlphaZero原理与启示

作者：唐川; 陶业荣^*; 麻曰亮

来源：航空兵器, 2020, 27(03): 27-36.

摘要

近几年,计算机围棋成功引发了又一轮的人工智能热潮,从计算机围棋中发展出来的AlphaZero框架成功地应用在其他完全信息条件下的二人有限零和博弈问题,进而展示出了深度学习和强化学习在智能决策领域的优异性能。本文首先介绍了AlphaZero框架中三个核心技术:深度学习、强化学习以及蒙特卡罗树搜索,然后详细说明了AlphaZero框架两个关键阶段——AlphaGo和AlphaGo Zero的基本原理,最后,对AlphaZero框架提出了自己的思考,并基于对AlphaZero原理的剖析讨论了其对军事决策智能化的启示。

收藏分享被引(13) 浏览

更新时间：2024-04-13 16:26

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号