摘要

数据隐私泄露风险评估在数据发布中起着关键的作用。当前在数据发布场景中,避免数据隐私泄露的方法主要是通过数据加噪、混淆、匿名等隐私保护方法进行数据隐私保护,然后进行数据发布共享。但是依然存在数据接收者利用已有数据或者背景知识对发布数据进行攻击,获取个人隐私信息的情况发生。现有的方法对于数据隐私保护后的数据隐私泄露风险却没有进行较好的定量评估。针对该问题,提出了一种面向数据发布场景的隐私泄露风险量化评估方法。首先将数据发布者的数据进行数值化处理,经过映射得到敏感数据矩阵;然后获取需求者对数据的具体需求进行隐私等级标记,计算得到字段属性隐私权重;接着结合隐私权重利用矩阵范数计算得出隐私风险值;最后,通过公开数据集进行评估方法的验证对比分析,验证了评估方法的准确性与效用性。该方法对于降低发布数据的隐私泄露风险,提高数据的共享度具有一定意义。