摘要
针对高端装备研制数据的保密性和重要性,提出一种基于生成对抗网络(generative adversarial networks,GAN)的高端装备研制数据脱敏方法。面对高端装备研制数据在数据挖掘和数据共享时可能面临泄露的风险,利用GAN进行数据脱敏。在随机生成的高斯数据集上进行实验,通过比较源数据和脱敏数据的统计特征,证明GAN的数据脱敏方法能够有效实现数据脱敏过程中所要求的数据安全性、数据有效性和成本可控性。最后,在Yeast数据集上进行验证,GAN输出的脱敏数据同样在现实世界数据集上表现出色,能够准确地预测Yeast的分类,为高端装备研制数据的管理和分析提供了一种新的思路。
- 单位