摘要

目的 筛选与结肠腺癌(colon adenocarcinoma, COAD)预后相关的关键基因。方法 分别从癌症基因图谱(The Cancer Genome Atlas, TCGA)数据库和基因表达综合(Gene Expression Omnibus, GEO)数据库下载COAD转录组数据和相应的临床信息。采用R语言程序包分别对两组数据进行差异表达基因分析和加权基因共表达网络分析(weighted gene co-expression network analysis, WGCNA),筛选共同的差异表达基因(differentially expressed genes, DEGs)。采用R语言程序包clusterProfiler对共同的DEGs进行富集分析。采用STRING数据库和Cytoscape软件构建蛋白互作(protein-protein interaction, PPI)网络筛选核心基因,并采用R语言程序包Survival和GEPIA2在线分析工具对核心基因进行生存分析,识别COAD预后相关的关键基因。最后采用人类蛋白质图谱(The Human Protein Atlas, HPA)数据库对关键基因进行验证。结果 差异表达基因分析和WGCNA分析得到153个共同DEGs。GO富集分析发现这些基因主要富集在离子运输、激素代谢等;KEGG通路富集主要与胆汁分泌、戊糖和葡萄糖醛酸酯相互转化、丙酮酸代谢等有关。PPI分析得到氯离子通道辅助蛋白1(chloride channel accessory 1,CLCA1)、甲状腺素受体结合因子13(thyroid hormone receptor interactor 13,TRIP13)等10个核心基因。通过生存分析和HPA数据库验证发现CLCA1基因与COAD的不良预后显著相关。结论 CLCA1基因的低表达对于COAD患者的不良预后具有重要影响,推荐将其作为靶点开展进一步基础及临床研究。