摘要

目的/意义 基于聚类的匿名化算法具有灵活性较高、适用范围较广、能够保留原始数据更多信息的特点。合理使用基于聚类的匿名化算法进行匿名化处理可以获得满足隐私保护需求的高质量医学数据。方法/过程 通过文献调研法和比较分析法,梳理面向医学数据共享、基于聚类的匿名化算法关键技术,概述该类算法的主要流程,归纳与之相关的隐私模型,包括具有代表性的传统隐私模型和个性化隐私模型,并分析代表性算法的优点和不足。结果/结论 应当合理选择基于聚类的匿名化算法类型、灵活改进算法模型,加大算法工具研发力度,以推动医学数据安全便利和高质量共享。

  • 单位
    中国医学科学院; 北京协和医学院