基于局部划分的匿名算法研究

作者:王芳; 余敦辉*; 张万山
来源:计算机应用研究, 2019, 36(10): 3048-3053.
DOI:10.19734/j.issn.1001-3695.2018.05.0352

摘要

针对泛化会造成数据信息损失量较大,且该缺陷会随数据维度变大而越明显的问题,提出一种基于局部划分的匿名算法。在确保k-匿名和l-多样性的前提下,基于敏感属性栏值约束和记录间距离将数据表横向分成若干个桶,然后对每个桶基于属性间的关联纵向分成多栏,最后对同一桶中各栏中的数据进行随机重排。实验结果表明,在处理高维数据时,与LGAA-CP算法相比,信息损失量减少了47%~183%,关联关系保留率提高了24%~118%。与Slicing算法相比,信息损失量相差在1. 5%之内,关联关系保留率提高了8. 9%~22. 8%。通过分析,该算法在同时确保高维数据的隐私保护能力和数据可用性方面是有效的。

全文