摘要

目的:本文旨在利用基因共表达与机器学习算法开发和验证与免疫浸润有关的多基因预后签名,以改善宫颈癌(CC)患者的预后预测。方法:从TCGA数据库下载CC患者表达和临床数据并进行预处理。将利用miRWalk2.0的12个数据库得到的靶基因与R语言中分析得到的差异表达基因交集作为候选基因。通过加权基因共表达网络(WGCNA)、COX回归和机器学习(LASSO COX回归)确定基因签名。将280例患者随机分为训练组(n=140)和验证组(n=140)。利用K-M曲线分析高/低危分组间的总体生存率差异。利用时间依赖受试者工作特征曲线(tROC)分析预后模型的预测能力。通过组合风险评分和AJCC分级,建立了诺谟图进行1年、3年和5年生存预测。利用基于支持向量机的CIBERSORT算法计算免疫浸润评分。并利用基因集富集分析(GSEA)分析与免疫浸润有关的信号通路。结果:miR-141-3p与CC患者的预后显著相关。WGCNA表明预后靶基因模块与T期,N期和AJCC期显著相关。通过LASSO COX回归分析确定了5个基因签名。时间依赖受试者tROC分析表明该预后模型具有较好的预后预测能力。生存曲线分析表明,高/低风险组的患者总体生存率存在显著差异。诺谟图(C-index=0.83)在预测患者生存率方面明显优于单独使用风险评分(C-index=0.77)和AJCC分期(C-index=0.70)。并且,不同风险组的免疫浸润水平也存在显著差异。与免疫系统有关的GSEA通路在高危人群中显著富集。结论:利用加权基因共表达网络、COX回归、机器学习算法(LASSO Cox回归)得到的与免疫浸润有关的新型5个基因签名与诺谟图,为CC患者提供了较好的预后预测。