虚拟乒乓球手的强化学习训练方法

作者:黎子聪; 曾繁忠; 吴自辉; 聂勇伟; 冼楚华; 李桂清*
来源:计算机辅助设计与图形学学报, 2020, 32(06): 997-1008.

摘要

沉浸感是虚拟现实应用的重要特征之一,而虚拟场景中角色行为的智能性与真实性对虚拟现实应用的沉浸感有着显著影响.利用强化学习方法对球拍的击球策略进行训练,根据乒乓球游戏规则设计了一系列奖励函数,使之能根据来球起点位置与初始速度生成球拍的有效击球轨迹;进而以球拍轨迹约束虚拟球员的持拍手腕关节,采取逆向运动学与强化学习相结合的方法估计出球拍击球时虚拟球手的击球动作,得到能用合理姿态进行成功击球的虚拟球手.消融分析实验验证了所提出的奖励函数的合理性与有效性;测试实验则表明,所设计的虚拟球手能以合理的击球动作击球,成功率达到93%以上,与基于模仿学习的方法相仿,且高于其他方法;但基于模仿学习的方法需要物理采集训练数据,而训练强化学习网络所需的数据只需随机生成,所需代价更低.