摘要

随着数据和算力向网络边缘下沉,人工智能应用的研发愈加依赖隐私敏感的用户数据。在这一趋势的推动下,联邦学习因其强调隐私保护的特性而已逐渐成为一个广泛应用的分布式机器学习框架。作为联邦学习的原始范式,横向联邦学习(HorizontalFederatedLearning,HFL)具有扩展能力强和使用场景广泛等特点,因此是近年来该领域内的研究重心,同时在产业界相关需求的驱动下有着十分广泛的应用前景。横向联邦学习的研究涉及机器学习、分布式系统、无线通信和信息安全等多个学术领域,从研究动机到技术方法都呈现多样化,但现有文献未能展现相关研究现状的全貌。此外,横向联邦学习相关技术的发展催化出了一系列开源系统框架、公开数据集以及多种场景下的应用,对进一步研究与实践都具有参考价值。为此,本文对横向联邦学习的研究现状和系统应用进行综合性调研。首先,对相关文献按照研究目标和技术角度进行全面地分类梳理,从多领域视角分析了各分支的研究现状。其次,从应用实践的视角,对比分析了面向横向联邦学习的主流系统框架与代码库、描述了数据准备方法以及典型的应用场景。在此基础上,阐明了横向联邦学习算法研究和系统应用面临的6个关键挑战,为如何缩小相关研究与系统实践之间的鸿沟提供了新的参考。