面向一对多记录的数据隐私保护方法研究

作者:杨海芳; 张玲玲*; 王明征; 胡祥培
来源:管理工程学报, 2023, 37(05): 142-155.
DOI:10.13587/j.cnki.jieem.2023.05.012

摘要

数据共享在大数据时代各领域中有重要的实际应用,但数据共享容易造成个人隐私的泄露问题。传统隐私保护方法主要基于简单关系数据展开研究,而对实际中较为普遍的多记录数据即个人与记录是一对多关系的数据的研究较少。在多记录数据中,具有关系型数据特征的准标识属性和具有事务型数据特征的敏感属性均可能构成攻击者的背景知识,增加了个人隐私泄露的风险。当攻击者具有强背景知识时,攻击者可以通过对个人的敏感属性取值集合(简称项集)的相关性质来挖掘个人隐私信息,基于此本文提出一种新的多记录数据隐私泄露风险。为了保护隐私,本文首先提出一个基于敏感值的闭集性和强多元性相结合的隐私模型(简称CEIR l-多元性模型),接着设计了能够实现该隐私模型的DACEL算法来执行对多记录数据的匿名处理。在两个敏感值密度不同的数据集上与其它基准方法进行对比,结果表明本文方法在隐私保护水平、匿名信息损失和计算效率等方面都有稳定的突出表现。

全文