摘要

应用生物信息学方法,构建结肠腺癌(COAD)丝氨酸蛋白酶抑制剂(SERPIN)家族相关基因预后模型。从TCGA数据库和GEO数据库下载结肠腺癌(COAD)转录组和临床数据,根据数据中SERPINs家族基因的表达量对COAD患者进行一致性聚类分析;将数据随机均分为训练集(Train)组和验证集(Test)组,基于两个亚型的差异基因,利用Train组进行COX回归和Lasso回归构建预后模型,根据模型风险评分中位值将样本分为高、低风险两组,绘制高低风险组患者生存曲线;通过ROC曲线评价模型预测能力;利用Test组数据验证模型;构建列线图,评估患者生存率模型预测值与实际值的一致性;并利用利用ESTIMATE算法和CIBERSORT算法评估风险评分和肿瘤微环境(TME)以及免疫浸润的相关性。通过34个SERPIN基因确定了两个亚型,基于2个亚型筛选出了436个预后相关分型差异基因,通过Lasso回归确定出了11个预后相关基因参与风险模型的构建,根据模型评分区分的高低风险组具有明显的生存差异,列线图可以准确预测1、3和5年生存率。肿瘤微环境分析和免疫浸润分析显示高风险评分组患者免疫活性差。SERPIN家族相关基因构建的风险评分模型能够预测COAD的预后,有利于进一步指导临床对COAD的诊治,提高患者生存率。

  • 单位
    哈尔滨医科大学附属第一医院