摘要

针对差分隐私保护k均值聚类算法(DP k-means)随机选取初始点,导致算法往往收敛于局部最优,进而影响聚类效果的问题,本文结合差分隐私的相关理论以及层次聚类的思想提出了一种基于差分隐私保护的二分k均值聚类算法(DP Bi-k-means)。首先,以得到全局最优为目标,将随机选取初始点的过程进行改进,由上至下对目标数据集进行二分;其次,在迭代过程实现基于拉普拉斯机制的差分隐私保护。经安全性分析以及实验结果证明:该算法与传统差分隐私保护k均值算法(DP k-means)相比,可以避免聚类结果受初始点的影响陷入局部最优解,从而优化聚类效果,并为聚类分析提供了有效的隐私保护能力。

  • 单位
    新疆财经大学