摘要

目的 采用生物信息学分析方法挖掘结直肠癌(CRC)关键基因,作为潜在的预后生物标志物。方法 从基因表达综合(GEO)数据库获取与CRC相关的GSE33113数据集。采用R软件中的limma程序包获取CRC组织与癌旁组织的差异表达基因,采用DAVID在线工具对差异表达基因进行基因本体论(GO)和京都基因与基因组数据库(KEGG)富集分析。采用加权基因共表达网络分析(WGCNA)输出关键模块基因,取模块关键基因与差异表达基因的交集作为候选关键基因。采用GEPIA数据库进行检索,将CRC组织与癌旁组织中表达存在显著差异,且与疾病预后相关的基因作为关键基因。选用不同数据集验证关键基因在CRC中的表达情况,采用GEPIA数据库验证关键基因在CRC中的表达情况和预后价值。采用受试者工作特征(ROC)曲线评估关键基因对CRC的诊断价值。采用基因集富集分析(GSEA)探索关键基因在CRC中的生物学意义。采用实时荧光定量聚合酶链反应(RT-qPCR)和免疫印迹法检测关键基因在人正常肠上皮细胞系HIEC和CRC细胞系HCT116、HCT15中的表达情况。结果 GSE33113数据集共包含90例CRC样本和6例癌旁组织样本,共筛出差异表达基因1 211个,其中上调505个、下调706个,多分布于细胞外间隙和胞外区,调控趋化因子介导的信号通路、炎症应答、细胞分裂等。WGCNA获取临床特征最显著相关的模块分别有24和96个关键模块基因,分别获得24和62个候选关键基因。经GEPIA数据库筛选,共获取6个关键基因(AQP8、PBK、EXO1、CCNB1、DEPDC1B和KPNA2)。选取EXO1进行验证,其在不同数据集中的CRC组织样本中表达均上调,GEPIA数据库分析结果显示,CRC组织中EXO1 mRNA呈高表达,CRC患者EXO1的表达与患者总生存期(OS)显著相关。ROC曲线分析结果显示,EXO1对CRC具有较高的诊断价值。GSEA结果提示EXO1可能通过影响细胞周期和DNA复制来调控CRC。RT-qPCR和免疫印迹法结果显示,EXO1在CRC细胞中的表达显著上调。结论 采用WGCNA发现6个与CRC相关的关键基因,其中EXO1可作为CRC潜在的预后生物标志物。