摘要
目的 通过生物信息学筛选出肝细胞癌(HCC)与正常组织的差异表达基因(DEGs),探索HCC预后生物标志物。方法 从公共基因数据库(GEO)筛选并下载3个微阵列数据集GSE101685、GSE84402和GSE62232,通过GEO2R在线分析平台对得到的基因芯片进行分析,可以得到癌组织与非癌组织的DEGs,利用DAVID数据库进行基因本体论(GO)功能富集分析及京都基因与基因组百科全书(KEGG)通路富集分析,应用STRING绘制出蛋白-蛋白相互作用(PPI)网络,导入Cytoscape软件用CytoHubba插件筛选出排名前10位的核心基因,通过Kaplan-Meier Plotter对每个核心基因进行生存分析,并绘制生存曲线,再通过GEPIA数据库进行表达量分析,进一步分析核心基因所涉及的信号通路。结果 数据集GSE101685、GSE84402、GSE62232分别筛选出459、471和292个DEGs。Venn图显示GSE101685、GSE84402和GSE62232数据集共同表达的DEGs有169个,其中上调DEGs 43个,下调DEGs 126个,通过上述相应分析,筛选出10个核心基因DLGAP5、BIRC5、CCNB1、CCNA2、TTK、NDC80、NCAPG、MAD2L1、BUB1B和RRM2。将10个核心基因通过Kaplan-Meier Plotter进行预后分析后,发现10个核心基因的过表达均会导致总体生存率的下降。将10个核心基因通过GEPIA数据库进行表达量分析,发现9个核心基因(DLGAP5、BIRC5、CCNB1、CCNA2、NDC80、NCAPG、MAD2L1、BUB1B、RRM2)表达差异有统计学意义,均P<0.05。其中核心基因BUB1B、CCNA2、CCNB1、MAD2L1和RRM2主要富集在p53信号通路和细胞周期。结论 BUB1B、CCNA2、CCNB1、MAD2L1和RRM2的过表达与HCC的不良生存率相关,可能成为HCC的预后生物标志物,可为HCC患者的治疗提供理论基础,DLGAP5、BIRC5、NDC80和NCAPG在HCC预后评估等方面值得继续探索。
-
单位大连医科大学; 大连市中心医院