摘要
利用生物信息学方法筛选与宫颈癌发生、发展和预后相关的血管生成相关基因(angiogenesis related genes, ARGs),并进行相关预后风险模型的构建与验证。首先从TCGA数据库中检索宫颈癌患者的表达谱和临床特征,并提取差异表达的ARGs,其次采用Lasso Cox回归筛选预后ARGs,构建相关预后模型,再次使用GSE52903和GSE44001数据集进行外部验证,最后利用基因集富集分析探讨宫颈癌预后机制。结果筛选出15个预后ARGs,分别为EFNA1、ITGA5、EPHB4、NRP1、CDH5、PLAU、BMP6、DLL4、JUN、CA9、MMP1、BAIAP2L1、SERPINF1、F2RL1和FGFR2。GSE52903和GSE44001数据集的Kaplan-Meier生存曲线显示,高风险组的总生存率(overall survival, OS)(P=0.005)和无病生存期(disease-free survival, DFS)显著低于低风险组(P<0.001)。ROC曲线分析结果显示,GSE52903验证集在1年、3年和5年的AUC值分别为0.84、0.77和0.73,C-index为0.72,GSE44001验证集在1年、3年和5年的AUC值分别为0.71、0.72和0.70,C-index为0.70,说明该模型对患者的预后预测具有很强的预测效能。GSEA分析富集的通路主要涉及DNA复制、ECM受体相互作用、补体和凝血级联等,这些过程与宫颈癌发生、发展紧密相关。以上结果推测这15个关键ARGs基因可能为宫颈癌预后潜在的生物标志物。
-
单位南京市第二医院; 南京中医药大学