面向搜索时间受限的完全信息博弈UCT算法改进研究

作者:张宜放; 孟坤; 蒋志文; 高世静; 张蕴瀚
来源:电脑知识与技术, 2021, 17(04): 195-200.
DOI:10.14004/j.cnki.ckt.2021.0375

摘要

针对完全信息博弈中搜索时间受限的算法设计问题,在考虑博弈模型不同特点及对结局影响程度的基础上,提出了分阶段的算法模型,给出了三阶段博弈算法设计方法。通过改造影响搜索策略的目标函数,使得在时间受限的前提下,能够方便控制每一阶段均更有效地搜索出较好策略,并给出相应的算法实现与分析。以点格棋为对象,给出了通过改造UCT算法中UCB公式的实现思路,设计了方向引导控制策略、多种算法混合、二进制压缩和并行化处理等技巧,有效提升了算法的效率和稳定性,并通过试验验证了所给出方法的有效性和效率。

全文