摘要

在联邦推荐系统中,各客户端能否获得满意的推荐效果不仅取决于自身参与模型训练的数据,也取决于进行联合建模时其他客户端提供的数据。然而出于对自身数据安全的保护且数据获取不易,各客户端倾向于尽可能少地提供自身数据,期望其他客户端提供更多的数据来获得较好的推荐效果。文章首先使用不完全信息博弈模型对客户端之间的交互行为进行分析,接着引入满足均衡概念对该模型进行解释,假定各客户端均有一个预期推荐效果,当所有客户端都达到预期推荐效果时,即该博弈达到均衡。该文提出一种基于均衡学习的迭代算法,客户端通过分析当前推荐效果动态调整本地模型训练的数据,最终使各客户端均达到满足状态。理论分析和实验仿真表明,所提算法可以使各客户端均达到满足均衡,完成收敛。