深度强化学习是当前机器学习领域中一个非常重要的研究方向,它通过环境对学习的反馈交互从而实现端到端的学习,能够解决一些维度高且规模大的问题。深度强化学习已经取得了多项引入注目的成果,但其缺点是鲁棒性差、局部探索能力不强、梯度易受影响。化学反应算法能够快速实现全局搜索,易于并行实现,且具有良好的鲁棒性。因此,将化学反应优化算法应用于无模型的深度强化学习方法,实践证明有一定的加速效果。