摘要

麻将及其不同变体的规则复杂,构建高水平的麻将博弈AI (artificial intelligence)算法及其测试环境等面临巨大挑战。本文分析了麻将博弈的相关研究文献,梳理出基于知识和基于数据的两大类麻将AI构建方法,分析了每种类型的构建方法的优势和局限性,重点分析了Suphx构建方法。指出了麻将AI构建面临的问题和挑战;提出将经验回放、分层强化学习、好奇心模型、对手模型、元学习、迁移学习、课程学习等应用到麻将博弈AI算法优化中,构建多元化的麻将AI评估指标、通用对抗平台和高质量的数据集等未来的研究重点。