摘要
针对现有的基于本地差分隐私的朴素贝叶斯分类方案存在计算、通信开销较高,以及采样率过低引起采样误差的问题,设计了一种满足本地差分隐私的频数预测算法,并将其应用于基于本地差分隐私的朴素贝叶斯分类器的训练。该频数预测算法的扰动机制基于指数机制设计,扰动输出的概率由效用函数决定,有效地提高了数据分类的效用。方案的用户端通过该扰动机制来完成本地隐私化的工作,服务器端通过收集用户扰动数据,对频数进行预测,恢复其统计特征。相较于传统的贝叶斯分类方案,不仅能够减少训练数据在收集过程中可能带来的隐私泄露问题,提高了分类准确率,而且降低了计算和通信开销。性能分析和实验结果验证了方案的隐私性、分类准确率以及有效性。
- 单位