摘要
计算机棋类游戏的研究目标是人工智能选手的智力提高,而学习样例对棋局局面的代表性,在很大程度上决定了选手的智力水平,但学习样例的产生方式和优劣判定一直未能引起足够重视.针对自对弈棋局样例产生中的选手筛选问题,本文提出了一种将体育赛制(混合赛制、循环赛制、淘汰赛制)和遗传算法结合的学习样例生成算法,来规范选手筛选过程并从而提高高质量样例的产生效率.该算法引入成熟公正的体育赛制组织形式为人工智能选手匹配和淘汰对手,将优胜者之间的对局做为学习样例,并使用遗传变异方法使选手逐代进化.在西洋跳棋上的实验结果表明,本文提出的样例生成算法可以有效产生样例;在样本规模综合指标T的评价下,混合赛制和循环赛制产生的学习样例具有更高质量;基于样例训练的选手能力对比表明,循环赛制最适合于西洋跳棋游戏的样例产生.
- 单位