摘要

目的通过生物信息学方法鉴定胃癌(GC)发生发展的关键基因,并寻找GC诊断和预后的生物标志物。方法从GEO数据库下载3个数据集(GSE54129、GSE29998和GSE19826)。利用在线分析工具GEOR2筛选出3个数据集中GC差异表达基因,并筛选出共有的GC差异表达基因。对共有的差异表达基因进行功能富集分析。通过STRING构建GC差异表达基因的蛋白质互作网络,应用Cytoscape软件筛选出关键基因。利用基因表达谱交互分析(GEPIA)数据库和Oncomine数据库分别对关键基因在GC组织和正常组织中的差异表达进行分析和验证。最后利用Kaplan-Meier plotter数据库和GEPIA数据库分别对关键基因在GC患者中的预后作用进行分析和验证。结果从3个数据库中共筛选出32个差异表达基因。GO分析显示,差异表达基因主要参与细胞外泌体和胞外区的细胞组成。KEGG信号通路分析显示,差异表达基因主要参与构建细胞外基质受体相互作用、蛋白质消化和吸收等。Cytoscape软件共筛选出7个关键基因,分别为COL5A2、XCOL12A1、THBS2、CTHRC1、PRRX1、COL8A1和CDH11,且7个基因均为上调基因。COL5A2、COL12A1、THBS2、CTHRC1、PRRX1、COL8A1、CDH11在GC组织的表达水平高于正常组织,且高表达患者预后较差。结论 COL5A2、COL12A1、THBS2、CTHRC1、PRRX1、COL8A1、CDH11基因可能在GC发生发展的中起重要作用,且与患者预后相关,可能为GC诊疗新的生物标志物。