摘要
差分隐私(Differential Privacy,DP)是一种新型的隐私保护模型,而直方图是差分隐私保护下数据发布的一种重要形式。现有的差分隐私直方图发布技术未能高效处理存在离群点的数据集。针对这一问题,基于桶重构思想,提出一种高效的、面向存在离群点数据集的差分隐私直方图发布的R-G-I方法。该方法包括三个重要的算法,第一步用梯度回归算法处理原始数据集,第二步用基于桶重构的贪心算法处理经第一步处理后形成的数据集,第三步用保序回归算法处理经第二步处理后形成的数据集。采用不同特点的真实数据集进行实验,结果验证了提出的直方图发布方法针对含有离群点的数据集的准确性和有效性。
-
单位国防大学; 上海交通大学