摘要

深度学习技术能够快速有效地从大量历史数据中学习规律和模式,但很多实际应用场景无法提供足够的训练数据,且要求模型对外部环境的变化快速作出反应。近一年来,联邦强化学习的发展为解决以上行业痛点带来了新思路,联邦强化学习不仅可以在隐私保护的条件下扩大样本数据,而且训练出的智能体可以跟随外部环境的变化作出合适的决策,比传统监督学习具有更好的泛化性和自适应性。本文总结了近一年来联邦强化学习的研究成果,包括基于深度Q学习算法和演员评论家算法的联邦强化学习算法,并从联邦模式、隐私保护和应用场景3方面展望其未来的研究方向。

  • 单位
    深圳索信达数据技术有限公司