摘要
数据发布中的隐私保护问题是目前信息安全领域的研究热点之一。针对异构数据聚类分析场景下现有的差分隐私模型无法在隐私保护过程中有效保证数据完整性和可用性的问题,提出一种基于聚类分析的差分隐私异构数据发布方法。该方法将聚类分析问题转化为分类问题,利用类标签对原始数据的聚类结构同时进行泛化匿名机制和添加噪声处理后,发布满足ε-差分隐私保护的异构数据集。该方法实现了灵活的隐私保护聚类分析,同时保证了异构数据的隐私性和可用性。理论分析与实验结果表明,所提出的方法相比于同类算法具有更好的隐私性与可用性,在提高数据隐私保护处理效率的同时,保证了聚类分析结果的准确性。
-
单位中国科学院信息工程研究所; 南方电网数字电网研究院有限公司; 信息安全国家重点实验室