摘要
目的探讨应用生物信息学筛选的结肠癌细胞焦亡相关基因特点, 对基于差异表达的细胞焦亡相关基因构建的结肠癌预后模型予以验证。方法从癌症基因组图谱(TCGA)数据库下载结肠癌患者RNA测序的基因数据和临床数据。通过检索文献确定52个与细胞焦亡相关基因, 将其与TCGA数据库中获得的结肠癌和正常结肠组织的RNA测序基因数据集进行对比, 获取差异表达的临床样本细胞焦亡基因, 应用STRING网站和R软件分析这些基因蛋白质互作网络。依据TCGA数据库临床样本中细胞焦亡基因的差异表达情况, 将TCGA数据库中结肠癌患者分为焦亡组和未焦亡组, 根据基因表达量, 以P<0.05筛选两组间差异表达明显的基因;基于这些差异表达基因, 采用LASSO Cox回归构建细胞焦亡相关的结肠癌预后模型。按照模型计算的风险评分的中位值将从TCGA数据库中收集的患者分为高风险(≥中位值)和低风险(<中位值)两组, 通过Kaplan-Meier生存函数分析两组总生存, 采用R软件的timeROC程序包分析应用风险评分预测TCGA数据库结肠癌患者生存不同时间的效能。采用多因素Cox回归分析临床病理因素及模型风险评分对TCGA数据库患者生存的影响。通过R软件分析、获取TCGA数据库结肠癌患者高、低风险组间差异基因, 应用R软件对差异表达细胞焦亡基因进行基因本体(GO)、京都基因和基因组百科全书(KEGG)通路富集分析及免疫细胞、免疫功能的单样本基因集富集分析(ssGESA)。结果依据TCGA数据库数据获得38个结肠癌组织与正常组织间差异表达的临床样本细胞焦亡相关基因。应用LASSO Cox回归建立了由13个细胞焦亡相关差异表达基因构成的预后模型, 即风险评分=0.118×MID2+0.354×IL20RB+0.083×HOXC11+0.011×TMEM88+0.021×SYNGR3+0.246×UPK3B+ 0.030×EGFL7+0.109×TMPRSS11E+0.138×IFITM10+0.161×RNF207+0.097×LINGO1+0.202×HEYL+0.025×ROBO3。生存分析显示, TCGA数据库高风险组的总生存较低风险组差(P<0.001);受试者工作特征(ROC)曲线分析显示, 预后模型风险评分预测TCGA数据库结肠癌患者生存1、3、5年的曲线下面积均>0.7。多因素Cox回归分析显示, 风险评分为TCGA数据库结肠癌患者生存独立影响因素(高风险比低风险:HR=3.988, 95%CI 2.865~5.551, P<0.001)。GO和KEGG富集分析显示, TCGA数据库中高、低风险组间差异表达基因(SULF1、FBLN2、COL1A1、DES、SFRP2、FNDC1、MYH11、APOE、C3、SPP1、COL1A2、COL10A1、THBS2、AEBP1、CNN1、IGHG1、SFRP4)在高风险组中均上调, 主要与细胞基质结构成分和细胞外基质(ECM)受体相互作用相关。ssGSEA法分析显示, 高风险组的免疫细胞浸润水平较高, 尤其是B细胞、巨噬细胞、肥大细胞、辅助性T细胞、肿瘤浸润性淋巴细胞明显高于低风险组;免疫功能方面, 高风险组趋化因子受体、免疫检查点、人白细胞抗原、副炎症、T细胞抑制、T细胞刺激、Ⅱ型干扰素反应高于低风险组。结论基于细胞焦亡相关基因构建的结肠癌预后模型对结肠癌患者预后预测有一定价值。细胞焦亡相关基因在结肠癌的肿瘤免疫中可能发挥重要作用, 可以用于结肠癌患者的预后分析。
-
单位北京中医药大学东直门医院