摘要

目的应用生物信息学方法分析结直肠癌(colorectal cancer,CRC)基因芯片数据,筛选差异表达基因(differently expressed genes,DEGs),探讨与CRC预后相关的关键基因及其相关的天然化合物,旨在为CRC的治疗提供新靶点并指导临床用药。方法在GEO数据库中下载CRC相关的基因芯片数据,通过绘制韦恩图筛选出两个芯片共同的DEGs。在此基础上,使用DAVID数据库对DEGs进行GO及KEGG富集分析,并通过String数据库构建蛋白质-蛋白质相互作用网络,使用Cytoscape软件分析筛选DEGs中的核心基因。进一步,GEPIA及UALCAN数据库用于验证核心基因的表达水平,并通过Kaplan-Meier plotter数据库对核心基因进行预后分析。最后,使用CCLE数据库和CTRP数据库进行匹配,筛选出与核心基因表达水平具有相关性的天然化合物,并通过STITCH数据库对其相关性进行验证。结果从两个基因芯片中筛选出22个共同上调的差异基因和74个共同下调的差异基因。PPI蛋白互作网络及多数据库共同筛选出具有显著预后意义的关键基因SPP1和MT1E。与正常结直肠组织相比,SPP1在结直肠肿瘤组织中高表达,并且与患者的不良预后呈正相关;MT1E在结直肠肿瘤组织中低表达,且表达水平与患者的不良预后呈负相关;药物敏感性分析筛选出5个与SPP1基因的表达水平具有相关性的天然化合物。结论 SPP1和MT1E基因可能成为评价CRC患者预后的生物标志物,并且葫芦素I、姜黄素、雷公藤甲素、根皮素、没食子儿茶素没食子酸酯对SPP1相关的结直肠肿瘤具有一定的药物反应相关性。因此,我们的研究可能为结直肠癌提供新的生物标志物并对其临床用药提供参考。