摘要

作为一类新兴的机器学习方法,联邦学习实现了“数据不动算法动”,为跨企业组织的数据流通提供了新的技术方案。然而,企业加入数据联邦的决策与其收益分享方式直接相关,若企业缺乏足够的参与激励,跨企业组织的联邦学习就无法形成,数据孤岛问题依然无法解决。本文考察了联邦学习应用的一个实际案例,其中数据提供方处于不同的行业,数据规模存在差异。在此场景下,本文主要分析三种不同收益分享机制分别如何影响异质数据提供方进行是否加入联邦学习的决策问题。分析得出的主要结论是:在个体收益分享机制、平等收益机制下联邦学习的形成主要取决于数据规模大的数据提供方的决策;在边际效用分享机制下则依赖于数据量小的提供方的决策。