摘要

目的 研究基于单样本基因富集分析(ssGSEA)分型构建肺腺癌的风险预测模型的价值。方法 从癌症基因组图谱(TCGA)数据库及基因表达数据库(GEO)中分别获取515例及116例肺腺癌患者的数据。基于TCGA数据库进行ssGSEA分析及聚类分析,将样本分为高免疫评分组和低免疫评分组,并进行免疫相关分析、富集分析及差异分析,进一步获得免疫相关的差异表达基因。将TCGA数据集患者以7∶3随机分为训练集和内部验证集。基于TCGA训练集的免疫相关差异表达基因数据,通过单因素Cox风险回归、套索算法(Lasso)回归以及多元逐步Cox风险回归分析降维,构建肺腺癌患者预后的预测模型,获得相应的风险分数(Riskscore),并用TCGA内部验证集及GEO外部验证集进行验证。将Riskscore与临床特征进行独立预后因素分析,建立列线图。ROC曲线与校正曲线分析分别用来评估模型的效能及拟合度。结果 根据患者样本的ssGSEA免疫评分、聚类分析及差异分析的结果,患者被分为高免疫评分组和低免疫评分组以及获得1 447个差异表达基因。再通过单因素Cox风险回归、Lasso回归以及多元逐步Cox风险回归分析降维,获得剩余8个预后相关免疫差异表达基因的最优集合和每例患者的Riskscore。该风险预测模型在训练集、内部验证集及外部验证集的AUC分别为0.703、0.713、0.750。根据独立预后分析结果,肺腺癌的分期及预测模型的Riskscore是肺腺癌患者的两个独立预后因子并联合绘制列线图。列线图1、3、5年总生存期的AUC分别为0.789、0.763、0.746。校正曲线分析也显示该模型的拟合度较好。结论 基于ssGSEA分型构建并验证的肺腺癌患者预后风险预测模型,具有较高的预后风险预测效能,可为临床医师判断肺腺癌患者总生存期提供辅助工具。