摘要
目前的隐私保护算法尚未充分考虑位置的语义信息,这极大影响了个人隐私安全。针对该问题,提出一种基于停留点和位置语义的TPSS算法来保护用户的真实位置数据,切断隐私信息泄露的源头。首先过滤掉异常位置并提取出具有代表性的停留位置点,从而有效降低数据处理量,缓解服务器的性能瓶颈。然后通过地理信息和中文维基百科语料库预训练Word2Vec词向量模型,计算出位置间的语义相似度。再利用多属性决策模型评估各位置在地理距离、位置语义和服务请求概率方面的表现以生成安全匿名集。最后,为停留点轨迹添加基于指数分布的噪声以进一步混淆真实数据。实验结果证明,该算法有效提高了位置语义的使用效果,在位置熵、语义、轨迹相似度等方面具有竞争力。
- 单位