基于生成对抗网络的文本序列数据集脱敏

张煜; 吕锡香<sup>*</sup>; 邹宇聪; 李一戈

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于生成对抗网络的文本序列数据集脱敏

作者：张煜; 吕锡香^*; 邹宇聪; 李一戈

来源：网络与信息安全学报, 2020, 6(04): 109-119.

摘要

基于生成对抗网络和差分隐私提出一种文本序列数据集脱敏模型,即差分隐私文本序列生成网络(DP-Seq GAN)。DP-Seq GAN通过生成对抗网络自动提取数据集的重要特征并生成与原数据分布接近的新数据集,基于差分隐私对模型做随机加扰以提高生成数据集的隐私性,并进一步降低鉴别器过拟合。DP-Seq GAN具有直观通用性,无须对具体数据集设计针对性脱敏规则和对模型做适应性调整。实验表明,数据集经DP-SeqGAN脱敏后其隐私性和可用性明显提升,成员推断攻击成功率明显降低。

单位
西安电子科技大学

收藏分享被引浏览

更新时间：2024-04-13 14:45

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号