基于聚类和压缩感知的高维数据发布算法

作者:刘振鹏; 陈杰; 王仕磊; 郭超; 李小菲*
来源:郑州大学学报(理学版), 2023, 55(02): 63-69.
DOI:10.13705/j.issn.1671-6841.2021515

摘要

针对现有高维数据发布机制中因“维度灾难”加入噪音过多,导致数据可用性低的问题,提出一种基于聚类和压缩感知的高维数据发布算法PrivCACS。根据属性敏感度对属性集进行聚类处理,利用互信息作为属性关联度将依赖度强的非敏感属性加至敏感属性集中,将属性集分为非敏感属性集C1和敏感属性集C2,进而得到对应的数据子集D1和D2。经过压缩感知,将会泄露隐私信息的数据子集D2降维转变为低维概要进行差分隐私加噪,通过改进正交匹配追踪算法重构出合成数据集,与非敏感数据集D1合并后进行发布。在真实数据集上的实验结果表明,所提出的PrivCACS算法在SVM分类上优于传统的PrivBayes和Jtree算法,在保障隐私的前提下,数据的可用性更高。

全文