摘要

目的构建基于代谢通路相关基因的乳腺癌预后预测模型并进行验证。方法从癌症基因组图谱(TCGA)数据库下载乳腺癌患者的基因表达数据和临床信息, 然后从基因集富集分析(GSEA)网站提取所有代谢通路相关基因进行差异分析, 获得肿瘤和正常组织中的差异表达基因, 再利用单因素Cox和最小绝对收缩和选择算子(LASSO)回归分析筛选出与预后相关的差异代谢基因用于构建预后风险评分。根据风险评分的中位数, 将患者分为高危组和低危组, 利用Kaplan-Meier生存分析、受试者操作特征(ROC)曲线对预后模型进行效能评价, 并将此模型联合其他临床因素构建列线图, 对乳腺癌患者进行生存率预测。最后通过基因表达综合数据库进行验证。结果通过单因素Cox和LASSO回归分析最后共筛选出了6个代谢相关基因(NT5E、PAICS、PFKL、PLA2G2D、QPRT和SHMT2)用于模型构建。在训练集和验证集中, 预后风险评分均是乳腺癌的独立危险因素, Kaplan-Meier生存分析结果提示, 高危组患者的总生存率均显著低于低危组, 差异具有统计学意义(P<0.001)。并且ROC曲线分析结果表明, 该列线图模型较其他临床病理特征预测准确性更高, 曲线下面积均为0.794。校准图显示预测值与实际值一致性较好。基于GSEA确定了该模型可以揭示代谢特征, 同时监测肿瘤微环境的状态。结论本研究构建的代谢相关基因预后模型可作为乳腺癌患者有前景的独立预后标志物, 并可提示肿瘤微环境的状态。