摘要
目的 通过机器学习等生物信息学方法筛选参与血管性痴呆(vascular dementia,Va D)发病机制的铜死亡关键差异表达基因(differentially expressed genes,DEGs),并预测和分析具有防治作用的中药。方法 基于GSE33000数据集筛选铜死亡DEGs并分析其相关性;对数据集样本进行聚类分型,应用基因集变异分析(gene set variation analysis,GSVA)分型后通路富集情况;应用加权基因共表达网络分析与Va D关系密切的基因并取交集获得重要基因;构建风险预测列线图模型筛选重要基因的风险因子;基于风险因子构建多种机器学习方法的预测模型并将其与铜死亡DEGs进行相关性分析得到关键基因,并进行防治中药的筛选。结果 共获得铜转运ATP酶β(ATPase copper transporting beta,ATP7B)、硫辛酸合成酶(lipoic acid synthetase,LIAS)等9个铜死亡DEGs,其相互之间表现出较强的协同或拮抗效应。根据铜死亡DEGs可将Va D患者分为2种亚型且DEGs在亚型间表达有所差异。分型后GSVA通路富集结果涉及刺猬信号通路等;绿松石模块(37个差异基因)与Va D分型高度相关,其与数据集DEGs交集得到5个重要基因,其中XLOC_005471可能是Va D的风险因子。广义线性模型(generalized linear models,GLM)机器学习模型的预测性能最高。脂酰基转移酶2(lipoyltransferase 2,LIPT2)、二氢脂酰胺S-乙酰基转移酶(dihydrolipoamide S-acetyltransferase,DLAT)、二氢硫辛酰胺脱氢酶(dihydrolipoamide dehydrogenase,DLD)、丙酮酸脱氢酶E1亚基β(pyruvate dehydrogenase E1 subunit beta,PDHB)与金属调节转录因子1(metal regulatory transcription factor 1,MTF1)与风险因子相关性较强,可作为铜死亡关键DEGs,其中MTF1、PDHB的表达与Va D患者年龄负相关(P<0.01)。根据铜死亡DEGs筛选出海蛤壳、鱼鳔胶等29味中药,其四气五味多属寒、温、平,苦、甘,归胃、肾、心、肝经,多为清热补虚药。结论 ATP7B、LIAS等9个铜死亡DEGs相互调控作用及其相关的刺猬信号通路可能是Va D铜死亡相关发病机制的重要环节,其中TLIPT2、DLAT、DLD、PDHB与MTF1是铜死亡关键基因。GLM机器学习模型可以较准确诊断Va D。ATP7B、LIAS等铜死亡DEGs可能有助于阐释Va D火热内盛伴有气虚或肾精亏虚证型的实质机制,海蛤壳、鱼鳔胶等中药可能为防治Va D潜在分子药物的来源。
-
单位广西中医药大学; 第一临床医学院