摘要
目的·基于单细胞RNA测序(single cell RNA sequence,scRNA-seq)技术构建结直肠癌预后预测模型。方法·利用GEO(Gene Expression Omnibus)数据库获取结直肠癌样本的scRNA-seq数据集,筛选与结直肠癌转移相关的差异基因作为预测模型的候选基因,运用套索回归算法(LASSO)、Logistic回归和Kaplan-Meier生存分析进一步在癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库中筛选及验证与结直肠癌预后相关的基因集,并建立结直肠癌预后预测模型。通过决策曲线分析和受试者工作特征(receiver operating characteristic,ROC)曲线评估预测模型在临床应用中的价值。结果·利用GEO数据库获取的scRNA-seq数据筛选出30个差异表达基因,进一步在TCGA数据库中利用LASSO回归得到9个关键基因,并以此对每例患者的关键基因表达进行评分。分别在训练集和验证集中对复发和未复发患者的评分进行比较,差异均有统计学意义(P<0.05)。采用Logistic回归分析将肿瘤原发灶分级(T stage)和是否发生远处转移(M stage) 2个独立的临床变量纳入评分-临床变量整合模型。对评分-临床变量整合模型的实际预测价值进行评估,ROC曲线在训练集和验证集的曲线下面积分别为0.775和0.705。结论·基于scRNA-seq结果,构建了较为稳定的结直肠癌预后预测模型,可供临床评估患者预后参考。
-
单位上海交通大学医学院附属仁济医院