摘要
目的探讨上皮-间充质转化(EMT)关键基因与结直肠癌(CRC)预后的关系, 构建个体化预后风险评分模型。方法从癌症基因组图谱(TCGA)和基因表达数据库(GEO)分别获取416例和532例信息完整的CRC样本数据, 从基因集富集分析(GSEA)数据库下载200个EMT相关基因。分析TCGA的测序数据得到肿瘤和正常组织中的差异表达基因, 与EMT基因集取交集得到62个差异表达的EMT基因, 包括23个上调基因, 39个下调基因。通过单因素Cox分析筛选出7个预后相关基因。进一步通过最小收缩与选择算子(LASSO)回归筛选出4个预后价值最高的基因构建风险评分模型。根据评分模型将患者分为高、低风险组, Kaplan-Meier生存曲线分析高、低风险组的生存差异。用GEO数据集对EMT风险评分模型进行验证, 分析高、低风险组生存差异。通过单因素和多因素Cox分析计算风险评分模型的风险死亡比。依据风险评分模型和临床病理特征构建临床列线图。高、低风险组间比较生存差异采用Log-rank检验。结果 TCGA下载的CRC样本信息经过分析得到4个与预后相关的EMT基因[胶原C-蛋白酶增强剂2(PCOLCE2)、催产素受体(OXTR)、脑源性神经营养因子(BDNF)以及丝氨酸蛋白酶抑制剂E家族1(SERPINE1)], 用于构建风险评分模型, 低风险组的总生存优于高风险组, 差异有统计学意义(χ2=13.9, P<0.01), ROC曲线提示风险评分模型具有良好的准确性, 1、3、5年曲线下面积(AUC)分别为0.815、0.863、0.870。GEO数据集验证风险评分模型的预测能力, 高、低风险组的生存差异有统计学意义(χ2= 8.4, P<0.01)。单因素和多因素分析结果显示风险评分模型是独立的预后因子。列线图可有效评估CRC患者1年、3年和5年的预后。结论基于EMT关键基因的风险评分模型可以准确预测CRC患者的总生存期, 基于该模型的列线图有助于评估患者的预后。
-
单位武汉大学人民医院