摘要

目的通过加权基因共表达网络分析(WGCNA)和单样本基因富集分析(ss GSEA)构建胰腺癌预后模型。方法获取胰腺癌组织转录组测序数据和患者预后信息,ss GSEA对各肿瘤组织17 810条通路进行评分,利用WGCNA、单因素分析和Lasso回归筛选各通路参数,构建多因素Cox比例风险回归模型对胰腺癌患者的预后情况进行预测,并对模型进行评价。结果经ss GSEA发现,不同胰腺癌组织各通路评分不同,如GO RECEPTOR REGULATOR ACTIVITY、GO MONOSACCHARIDE BINDING等通路,提示不同患者各通路活性有差异,这可能是引起肿瘤向不同结局发展的重要原因。经WGCNA分析采用动态剪切树法合并表达相似的通路模块,最终得到7个通路模块。其中,Blue模块中包含的通路最多,含3 098条通路。Red模块与胰腺癌患者生存状态有较高的正相关性(r=0.33,P <0.001),Black模块也与其生存有显著的相关性(r=0.11,P=0.03)。同时,Red模块(r=0.30,P <0.001)和Blue模块(r=0.24,P=0.002)与胰腺癌组织学分期有显著的正相关性; Blue模块(r=0.27,P <0.001)、Yellow模块(r=-0.17,P=0.03)、Black模块(r=0.30,P <0.001)和Magenta模块(r=0.15,P=0.03)与胰腺癌肿瘤分期有明显的相关性。使用单因素分析、Lasso回归筛选Red模块中与生存预后相关的通路,共得到11条与胰腺癌患者生存预后相关的通路。进一步利用多因素Cox回归建立多通路预后预测模型,最终得到由5条通路构成的胰腺癌预后预测模型,C指数为0.7,赤池信息准则(AIC)为776.49,且该模型具有良好的预测效能(AUC=0.742)。结论 WGCNA和ss GSEA技术在胰腺癌预后模型的构建中有重要作用。

全文