摘要

针对数据挖掘模型中存在的隐私泄漏问题及现有隐私保护技术的不透明性,本文将差分隐私与图像生成模型生成对抗网络(Generative adversarial network,GAN)相结合,提出了一种更具普适性的支持图像数据差分隐私保护的生成对抗网络模型(Image differential privacy-GAN,IDP-GAN)。IDP-GAN通过差分隐私的拉普拉斯实现机制,将拉普拉斯噪声合理地分配到判别器的仿射变换层的输入特征以及输出层的损失函数的多项式近似系数中。在实现差分隐私保护的同时,有效地减少了训练过程中隐私预算的消耗。标准数据集MNIST和CelebA上的实验验证了IDP-GAN可以生成更高质量的图像数据,此外用成员推理攻击实验证明了IDP-GAN具有较好的抗攻击能力。

全文