摘要

目的:研究如何整合并优化影像、神经认知评价和生物标志测量等多来源多模态数据以提高阿尔兹海默症(Alzheimer disease,AD)发展阶段和转化的分类预测准确率。方法:基于阿尔兹海默症影像计划(Alzheimer’s disease neuroimaging initiative,ADNI)2004—2018年4个阶段的样本数据,包括从核磁共振成像(magnetic resonance imaging,MRI)影像数据提取的脑图像特征数据、神经认知量表(简易精神状态测量量表和ADAS-Cog13量表)数据、生物标志测量数据(Abeta、Tau和p-Tau蛋白及ApoE4基因型)。基于783个样本的基线数据建立二分类和多分类Logistic回归模型用于疾病发展阶段的两两和同时分类预测。基于具有轻度认知障碍(mild cognitive impairment,MCI)状态的352个样本的纵向数据建立二分类Logistic回归模型并用于转化状态的分类预测。将脑图像特征变量、量表数据和生物标志加入到基准模型中,通过交叉验证方法随机划分数据集,并计算准确率、查准率、召回率、F1得分和ROC曲线下面积(area under curve,AUC)等指标进行综合比较,得到最优多模态组合的分类预测模型。结果:对于AD发展阶段的分类,结合脑图像特征数据、量表数据和生物标志数据建立二分类Logistic模型表现最佳,区分AD组和正常组、MCI组和正常组以及AD组和MCI组的准确率分别达到了100.00%、77.18%和89.58%;AUC值分别为100.00%、85.52%和96.39%,比仅用脑图像数据进行进展阶段的分类预测有显著提高。对于MCI是否转化的分类预测,脑图像特征数据结合量表数据和生物标志能最大限度地提高准确率,从86.69%提高到90%以上;相应的AUC值从89.21%提高到94.06%。结论:结合多来源数据能提高AD疾病进展阶段和转化的分类预测准确率,为临床诊断AD所处的发展阶段和转化提供理论上的支持。