摘要

分类型数据聚类是数据挖掘的重要研究内容,聚类数据中通常包含用户一些敏感信息.为保护聚类数据中的用户隐私,当前主要采用基于可信第三方隐私保护模型,但现实中第三方也存在隐私泄露风险.针对此问题,该文引入本地差分隐私技术,提出一种去可信第三方的K-modes聚类数据隐私保护方法 .该方法首先利用随机采样技术对数据进行采样,然后使用本地差分隐私技术对采样数据进行扰动,最后通过聚类服务端与用户的交互迭代完成聚类.在聚类过程中,无需可信第三方对数据进行隐私预处理,避免了第三方泄露用户隐私的风险.理论分析证明了该方法的隐私性和可行性,实验结果表明该方法在满足本地差分隐私机制的前提下保证了聚类结果的质量.