摘要

目的:针对结直肠癌(colorectal cancer,CRC)预后的肿瘤标志物尚缺乏可靠的准确度和灵敏度。本研究旨在采用生物信息学方法,筛选并验证一组与CRC诊断与预后相关的基因。方法:从NCBI-GEO数据库中选取关于CRC和正常结直肠黏膜(colorectal mucosa,CRM)组织标本全RNA组测序数据集GSE31905、GSE35279和GSE41657,并分析其中的差异表达基因(differentially expressed genes,DEGs),先通过Venn图获取这3个数据集的共同DEGs,然后用STRING网络系统和Cytoscape软件进一步富集上述基因,最后在Kaplan-Meier plotter网站上验证富集后的基因与CRC预后的相关性。结果:通过NCBI-GEO数据库中自带的GEO2R工具分别筛选出3个数据集中CRC与CRM的DEGs(|log2FC|>2和P<0.05)。用Venn图分析软件,将3个数据集中的上调/下调基因分别取交集,得出3个样本共105个共有的上调基因和140个共有的下调基因。将上述上调/下调基因导入STRING网络系统,得出相互作用的基因。将相互作用的基因集导入Cytoscape软件,用MCODE(Molecular Complex Detection)插件查找到61个上调基因。最后通过Kaplan-Meier plotter网站,得到EPHB2、KLK8、DIAPH3、STC2、OXTR、MMP7、MET、KRT85、KRT6B、KRT23、KLK10等11个在CRC中高表达的基因,且与预后相关。结论:通过生物信息学分析和验证,上述11个基因可在一定程度上预测CRC的不良预后,为CRC的诊断、治疗和预后提供可能的靶标。