本项目提出了机器人战斗强化学习的模型。通过引入PyGame的虚拟环境,在预先定义的环境中开展训练模型,核心模型是神经网络在深度Q学习中应用模拟决策过程的功能。除了DQN之外,还在训练过程中应用了角色评判方法。通过比较两个模型输出的差异,进行了深入讨论研究和改进。