摘要

逻辑回归作为一种典型的机器学习算法,广泛应用于医疗诊断、金融预测等领域。由于单个用户没有足够的样本构建高精度模型,传统的集中式训练又会导致隐私泄漏,因而构建具有隐私保护的逻辑回归模型受到广泛关注。现有的要求用户和服务器之间进行交互的方案导致了高昂的计算成本和通信负担。本文提出一种高效的非交互式逻辑回归训练协议,利用具有“良可分离结构”的梯度更新公式,解耦了样本数据和模型参数之间的计算耦合性,保证用户与服务器之间的单向单次传输性,即用户将本地数据整合并以秘密共享的方式上传给云服务器后即可离线;训练阶段设计了基于矩阵和向量运算的协议,保证服务器在每次迭代中使用固定的信息更新参数,降低了计算成本和通信开销。同时,提供了协议的安全性分析和数值实验,对来自UCI库的4个真实数据集上训练逻辑回归模型的实验结果表明,在保证模型精度的前提下,与最新的隐私保护逻辑回归方案VANE相比效率有较大提升(80~120倍),且与明文域中的训练时间相近。

全文