摘要

<正>Uber AI研究院近日连续发表5篇论文,介绍了他们在基因算法(Genetic Algorithm)、突变方法(Mutation)和进化策略(Evolution Strategies,ES)等神经演化思路方面的研究成果,同时结合实验证明了神经演化可以替代随机梯度下降(Stochastic Gradient Descent,SGD)等现有主流方法用来训练深度强化学习模型,取得更好的表现。(1)基因算法可作为训练深度神经网络的高效替代方案