摘要
目的 利用公共数据库构建和评估乳腺癌焦亡相关预后模型。方法 在TCGA和GEO数据库中下载乳腺癌相关基因表达矩阵和临床信息,收集焦亡相关基因并探究差异表达基因及关键基因,通过LASSO回归构建基于TCGA数据库的焦亡相关风险评分模型,使用GSE20685和GSE42568数据集对模型进行验证,并探究风险评分与临床分子免疫特征的相关性,在高低风险亚组中分析功能富集途径及基因组改变状态,结合临床特征构建列线图模型并进行综合评估。结果 共收集35个焦亡基因,其中32个为差异表达基因,包括18个表达下调基因和14个表达上调基因,35个基因集中PYCARD、AIM2、IL18、CASP1、CASP5、CASP8、NLRC4、IL6、NLRP3和TNF为焦亡通路的关键基因;从32个焦亡相关差异表达基因中鉴定出5个具有预后价值的基因:CASP9、GSDMC、GZMA、IL18和PYCARD,使用LASSO-Cox回归分析构建评分模型:风险评分=0.107 146 60×GSDMC表达值-0.207 295 50×CASP9表达值-0.205 471 10×IL18表达值-0.038 234 58×PYCARD表达值-0.092 932 92×GZMA表达值;风险评分模型显示,CASP9、IL18、PYCARD、GZMA上调与预后良好相关,GSDMC上调与预后不良相关;高风险组预后较低风险组差(P<0.001),且免疫浸润水平较低;男性、导管癌、肿瘤大于2 cm、三阴亚型、高MSI和TMB状态的患者风险评分较高;功能分析显示,高风险组上调基因集中在上皮细胞生长、角质化及炎症因子介导的信号通路;高风险组下调基因富集于生物代谢反应;基因改变显示,TP53基因突变与乳腺癌发生细胞焦亡密切相关,且TP53-PIK3CA互斥突变;单因素和多因素Cox分析显示,焦亡风险评分可作为预测乳腺癌生存状态的独立预后指标,该列线图预测患者总体生存率性能良好(C-index=0.7618)。结论 本次构建的预后模型和对细胞焦亡的综合性探索有助于乳腺癌患者的预后风险预测和个体化治疗。
- 单位