基于强化学习的爱因斯坦棋的算法研究

作者:向宇涛; 朱道易; 王忠桃; 董羽
来源:电脑知识与技术, 2020, 16(22): 179-181.
DOI:10.14004/j.cnki.ckt.2020.2620

摘要

爱因斯坦棋是我国全国大学生指定计算机博弈比赛项目之一,在本文发表之前,多数队伍使用了搜索树算法来参加比赛,而为了提高算法的表现,多数算法需要加入具体的模板处理。然而,如果需要得到最优表现,则要加入大量模板并尽可能地搜索更深的博弈树。而使用深度强化学习并结合使用树搜索不仅不需要加入过多的模板处理、搜索深层树节点,还能随着接收不同的算法和样本,智能体可以逐步地改善表现,并进一步提高胜率。因此,本文通过使用了深度强化学习中的DQN算法,并结合了极大极小树搜索算法和随机生成行为法测试了该算法的胜率,最后取得了远优于这两种方法的结果。

全文