摘要
随着大数据的运用不断发展,数据中的个人敏感信息面对的泄露风险越来越大。在发布数据时,可以通过数据脱敏来保护个人敏感信息。当前主流的脱敏技术有k-匿名、l-多样性和t-保密三种,都没有对数据语义的考虑。为了更好地保护复杂语义下高敏感度的敏感属性值,文中选用t-保密脱敏技术,以海林格距离作为度量方式,通过敏感属性值分类加权引入铭感信息度量。数据分析及实验结果表明,该方法在可接受的脱敏时间开销增长下,加强了对复杂语义的敏感数据的保护能力。同时分类加权方式方便灵活,可以满足实际使用中的不同需求。
- 单位