摘要

目的针对当前中医药临床数据发布方法在保护患者隐私时未考虑信息损失而导致数据在后续的分析处理中不可用的问题,提出一种面向中医临床数据发布的隐私保护算法。方法采用基于聚类的个性化K-匿名算法对原始数据集的准标识符属性,按照用户自定义的个性化泛化树进行泛化,并将泛化后的记录聚类成满足K-匿名约束的等价类,在实现患者隐私保护的同时减少信息损失。结果应用该算法实现了中医电子病历安全发布系统,系统运行结果表明数据发布结果满足匿名约束,可以在10秒内对小于6000条记录的数据集完成匿名处理,匿名后的数据可用性较高。结论该算法具有较高的可行性和有效性,在功能上可以满足发布过程的隐私保护和处理过程的数据可用性,在性能上可以满足业务系统的实际需求。