摘要

生成对抗网络(GANs)模型可以生成具有高分辨率“不存在”的物体真实图像,故近期被广泛应用于各种人工合成数据,尤其在人脸图像生成领域。然而,由于基于该模型的人脸生成器通常需要根据不同身份高度敏感的面部图像进行训练,其中存在潜在数据泄露使攻击者得以对身份成员关系进行推断。针对上述问题,首先设计对查询身份所获取样本与其实际参与训练样本之间存在巨大差异时的身份成员推理攻击,这些差异导致基于样本推理身份成员关系的性能急剧降低;其次,在此基础之上设计基于各身份解耦表征的重建误差攻击方案,在最大化的消除不同样本间背景姿势等因素影响的同时,消除巨大年龄跨度导致的表征差异,进一步提高了攻击性能;最后,基于三个代表性的人脸数据集在三个主流GAN架构上训练生成模型并进行攻击,实验表明,在各种攻击场景下,此攻击方案较之前研究AUCROC值平均提高0.2。