摘要
目的通过生物信息学分析鉴定宫颈癌(cervical cancer,CC)的潜在诊断、预后基因。方法下载GEO数据库中GSE90738数据集和TCGA数据库中的宫颈癌转录组数据用于生物信息学分析。使用R软件中"Limma"包分别鉴定GSE90738数据集和TCGA数据库中宫颈肿瘤组织与宫颈正常组织间的差异表达基因,使用Venny识别出共享差异基因并使用R软件"clusterProfiler"包进行共享差异基因的GO富集分析和KEGG信号通路分析。使用STRING数据库和Cytoscape软件筛选Hub基因。采用单因素Cox回归分析和多元逐步Cox回归分析识别和构建预后Hub基因风险标识(HGRS)。通过GEPIA2工具进一步验证Hub基因的转录表达情况。采用受试者工作特征(receiver operating characteristic,ROC)曲线、Kaplan-Meier曲线分析评估HGRS对宫颈癌诊断及预测价值。结果总共识别出了319个上调共享差异基因和167个下调共享差异基因。染色体分离和细胞周期是主要的生物学过程。确定了可能与宫颈癌的发病机制高度相关的16个基因。通过多元逐步Cox回归分析构建由4个基因[包括CENPM(HR:0.633,95%CI:0.421~0.952)、ANLN(HR:1.753,95%CI:1.241~2.476)、CHAF1A(HR:0.573,95%CI:0.338~0.970)、HELLS(HR:0.604,95%CI:0.325~1.124)]组成的HGRS,Kaplan-Meier生存曲线表明HGRS的高风险组相较于低风险组总体生存较差(P<0.001);ROC曲线显示HGRS预测宫颈癌的1年AUC为0.67(95%CI:0.53~0.81),3年AUC为0.72(95%CI:0.64~0.81),5年AUC为0.76(95%CI:0.66~0.85)。结论通过整合生物信息学分析鉴定了4个Hub基因,这些Hub基因可能是宫颈癌早期诊断的潜在分子生物标志物。
-
单位公共卫生学院; 新疆医科大学