基于生物信息学分析筛选与鉴定结直肠癌的关键生物标志物

作者:杨铁成; 方效昌; 窦婷亭; 王华桥; 杨丽洁; 石丽稳; **雯; 李炫飞; 谢伟*
来源:中华实验外科杂志, 2021, 38(09): 1775-1777.

摘要

目的通过生物信息学分析结直肠癌组织与正常癌旁组织的基因表达数据集,筛选出参与并影响结直肠癌发生发展的关键差异表达基因。方法从基因表达谱(GEO)数据库中下载3个结直肠癌组织信使RNA(mRNA)芯片数据集,为数据集GSE35279,数据集GSE50746和数据集GSE87211,共包括173个正常癌旁组织和297个结直肠癌组织。进行分析筛选,获得差异表达基因(DEGs)。使用标注可视化和集成发现数据库(DAVID)用于富集分析。通过STRING和Cytoscape数据库构建蛋白与蛋白相互作用网络,并得到关键DEGs。利用UALCAN、基因表达谱动态分析(GEPIA)等数据库分析关键基因的表达和生存分析,使用Log-rank检验方法。结果在结直肠癌和正常癌旁组织中共识别出212个DEGs和10个核心基因。GEPIA总生存期曲线显示,金属蛋白酶抑制剂-1(TIMP1)、分泌型磷蛋白1(SPP1)、蜗牛家族转录抑制因子1 (SNAI1)和胰高血糖素(GCG)的表达水平与结直肠癌患者总体生存率有关。高表达组TIMP1、SPP1和SNAI1结直肠癌患者总体生存率分别显著低于低表达组患者,并且低表达组GCG结直肠癌患者总体生存率显著低于高表达组患者,其结果具有统计学意义(P<0.05)。结论筛选出4个结直肠癌临床诊断和预后的生物标志物,为进一步研究结直肠癌发病分子机制以及早期诊断和预后提供基础依据。

  • 单位
    武汉大学中南医院