摘要
目的 本研究从全基因组和候选基因组的角度探究多基因风险评分(polygenic risk score, PRS)与机器学习对轻度认知障碍(mild cognitive impairment, MCI)发展为阿尔茨海默病(alzheimer′s disease, AD)的预后预测性能,为MCI发展为AD的第5年预后预测建模提供更有力的方法理论依据。方法 借助聚类与阈值(clumping and thresholding, C+T)、多基因风险评分-连续收缩(polygenic risk scores-continuous shrinkage, PRS-CS)、随机生存森林(random survival forest, RSF)、生存支持向量机(survival support vector machine, SSVM)4种常用统计方法对MCI发展为AD的第5年生存情况进行预测建模。利用C+T与PRS-CS得到的AD遗传风险得分作为独立的预测因子纳入Cox比例风险回归模型,RSF与SSVM则从候选基因组角度直接纳入所有与AD有关的单核苷酸多态性(single nucleotide polymorphism, SNPs)进行统计建模。最后,采用C指数作为模型预测效果的评价指标。结果 无论是C+T还是PRS-CS方法,在全基因组和候选基因组两种情况下的C指数差值均<0.01,而两种方法的C指数差值最大为0.04,二者差异均无统计学意义;机器学习的方法明显好于PRS方法,RSF和SSVM的C指数均能达到0.76,较C+T、PRS-CS高0.07、0.11,差异有统计学意义(均P<0.05)。结论 机器学习方法表现优异,为MCI发展为AD的预后预测提供了更为可行的统计建模方案。
-
单位山西医科大学; 公共卫生学院