摘要

本发明提出一种基于深度确定性策略梯度的联邦学习分类模型训练方法,实现步骤为:构建联邦学习分类系统;客户端获取联邦学习数据集;中央服务器为每个客户端构建联邦学习分类模型和深度确定性策略梯度模型;客户端初始化联邦学习训练参数;客户端得到联邦学习分类模型的状态;客户端对深度确定性策略梯度模型的权重参数进行本地更新;客户端获取联邦学习本地训练超参数并记录动作;客户端对联邦学习分类模型的权重参数进行本地更新;中央服务器聚合联邦学习分类模型权重参数;客户端得到联邦学习分类模型。本发明降低了在选择联邦学习本地训练超参数时客户端的计算资源开销和内存资源开销,以及中央服务器的通信资源开销。