摘要

利用传统方法保护个性化检索中的数据隐私,在一定程度上抵抗了非法者的攻击,保护了用户隐私数据的安全,但导致个性化检索准确性降低。针对上述问题,提出一种大数据环境下个性化检索中保护数据隐私的方法。该方法将差分隐私与P-link技术相结合,将个性化检索中的用户兴趣模型匿名化,从而实现数据隐私保护。利用差分隐私将用户的标示符泛化并添加噪音,在保证检索准确性的前提下,实现隐私数据的初次匿名化。运用P-link技术将初次匿名化隐私数据微聚为P-link等价组,并计算其兴趣条目的权值和质心,完成隐私数据的二次匿名化。结果表明,与传统发放相比,这种方法的抗窃取率和查准率得到极大提高,解决了个性化检索技术中用户隐私保护和检索性能之间的矛盾。

  • 单位
    周口师范学院