摘要
统计前向规划(statistical forward planning,SFP)算法使用仿真模型(也称为前向模型)自适应地搜索有效的动作序列,此类算法提供了一种简单通用的方法,为各种游戏提供快速自适应的AI控制。介绍了两种常用的SFP算法:蒙特卡罗树搜索和滚动层进化,并证明了在没有任何事先训练的情况下,SPF算法就可以在各种视频游戏中出色地运行。
-
单位中国科学院大学; 复杂系统管理与控制国家重点实验室; 中国科学院自动化研究所