摘要

<正>近日, DeepMind宣布开源一个用于在TensorFlow环境中开发强化学习智能体的代码库TRFL,并打包许多有用的基础组件(https://github.com/deepmind/trfl/)。DeepMind用于开发DQN、DDPG以及IMPALA(重要性加权行动者–学习者架构)等知名强化学习技术的许多关键算法组件都包含在其中。TRFL包含许多功能,可以实现经典强化学习算法以及更现代的算法。对于基于值的强化学习, DeepMind的研究人员也在TRFL中提供了各种TensorFlow操作,便于在离散的行动空间中学习,如TD学习、Sarsa、Q-learning以及其变体;当然