摘要

针对目前现有算法对隐私敏感数据进行过滤时,仅使用单一的近似度获取方法,在求取近似度时存在一定的局限性,导致平均绝对误差(MAE)值和均方根误差(RMSE)值高的问题,提出了一种基于模糊近似度的隐私敏感数据过滤算法。首先通过改进的局部敏感哈希算法E2LSH对数据进行降维处理,获取到更利于后续近似度计算的低维数据,然后采用Paillier同态加密算法在保证数据安全性的前提下对隐私敏感数据信息进行提取,最后构建梯形模糊评分模型,通过修正余弦相似性和皮尔森相关相似性的混合模型相似性算法对模糊近似度进行计算,完成对隐私敏感数据的过滤。分析实验结果可知,本文方法的MAE最低值低于0.82,说明该方法能够有效地降低MAE值和RMSE值,提升数据过滤效果。

全文