摘要
在AI游戏领域,实时策略(Real-Time Strategy, RTS)游戏十分复杂,一方面,实时策略游戏中“策略”的制定过程是即时的,另一方面,RTS游戏的状态动作空间庞大、环境仅部分可观测,而且策略制定过程中,行动指令的参数配置对行动结果影响很大。为了在线学习解决RTS游戏中行动指令参数配置优化这一问题,引入了Q-Learning算法训练作战单位选择使其自身行动指令效果最优的参数配置,同时,为提升算法的收敛速度,引入了几种不同的行动选择策略进行对比。为验证所用方法的有效性,实验在游戏仿真平台上对其中一种作战单位的行动指令进行了综合评估。结果表明,对RTS游戏中行动指令参数配置的优化问题,Q-Learning算法的在线学习能力,能非常迅速地学习到作战单位行动指令的最优参数配置。
-
单位重庆师范大学涉外商贸学院; 三峡大学