联邦学习在多中心遗传健康指数构建中的应用进展

作者:赵艳艳; 王金兰; 王晓霞; 徐东海*; 薛付忠
来源:中华疾病控制杂志, 2022, 26(10): 1187-1191.
DOI:10.16462/j.cnki.zhjbkz.2022.10.013

摘要

个体健康指数是根据健康指数构建的一个重要维度。而遗传因素是个体健康水平评估的重要组成部分。众所周知,复杂疾病不遵循孟德尔遗传定律,其受多个效应微小基因位点影响。多基因风险评分(polygenic risk score, PRS)是近年来被广泛应用的个体遗传因素评分。PRS可以综合与疾病相关的基因位点,从而对复杂疾病实现风险预测和精准预防。但是种族的不平衡问题会影响多基因风险评分的泛化能力。而充分整合多个数据中心的数据可以有效增加不同种族样本量从而减轻不平衡性,是缩小种族之间健康差距的重要方法。随着人们对数据隐私安全和所有权的关注度不断提高,如何在保护数据隐私的前提下充分利用各个数据中心的数据资源和计算资源引起了越来越多学者的重视。而基因组数据的独特性使个体基因组数据的隐私保护变得格外重要。本文将讨论多中心基因组数据分析中的隐私保护方法,包括同态加密、安全多方计算、Meta分析、联邦学习、同态加密与联邦学习的结合。进而讨论联邦学习框架下多中心PRS构造的统计方法。

全文