摘要

利用不同来源的数据参与机器学习模型的训练,能够使得训练出的模型的预测结果更加准确。但是,大量的数据收集则会产生隐私方面的相关问题。FATE联邦迁移学习是一个基于同态加密的联邦学习框架。针对FATE联邦迁移学习中同态加密计算复杂导致的模型训练效率低下的问题,提出了基于茫然传输协议的安全矩阵计算方案,通过实现矩阵加法和乘法以及数乘的安全计算,设计了两方交互下具有数据隐私保护特性的机器学习模型的损失函数计算与梯度更新,并以此来构造更高效的FATE联邦迁移学习算法方案。在此基础上,通过茫然传输扩展协议和通信批量处理,减少了需要调用的茫然传输协议的数量,缩减了通信轮数,从而降低了茫然传输协议带来的通信消耗。性能分析的结果表明,该方案的安全模型满足安全性和隐私保护性,并且具有一定的可扩展性;实验结果表明,在局域网环境下,该方案的模型收敛的平均时间比基于同态加密的方案要缩短约25%,并且随着数据样本特征维度增加,该方案的收敛速度的优势仍然能保持稳定,具有一定的实际应用意义。

全文