基于强化学习的爱因斯坦棋的算法研究

向宇涛; 朱道易; 王忠桃; 董羽

doi:10.14004/j.cnki.ckt.2020.2620

摘要

爱因斯坦棋是我国全国大学生指定计算机博弈比赛项目之一,在本文发表之前,多数队伍使用了搜索树算法来参加比赛,而为了提高算法的表现,多数算法需要加入具体的模板处理。然而,如果需要得到最优表现,则要加入大量模板并尽可能地搜索更深的博弈树。而使用深度强化学习并结合使用树搜索不仅不需要加入过多的模板处理、搜索深层树节点,还能随着接收不同的算法和样本,智能体可以逐步地改善表现,并进一步提高胜率。因此,本文通过使用了深度强化学习中的DQN算法,并结合了极大极小树搜索算法和随机生成行为法测试了该算法的胜率,最后取得了远优于这两种方法的结果。

单位
成都理工大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-04-12 21:11

基于强化学习的爱因斯坦棋的算法研究

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友