摘要

目的局部晚期直肠癌仅10%~30%的患者显示出病理完全缓解。文中利用基因表达谱分析预测局部晚期直肠癌新辅助化放疗(NCRT)病理学缓解的基因标签。方法从GEO数据库中筛选具有新辅助化放疗后病理学缓解分级的局部晚期直肠癌基因表达谱数据,并获得4个数据集GSE35452、GSE46862、GSE68204和GSE53781。合并前3个数据集并对批次效应校正后分为训练集(n=121)和内部验证集(n=53),最后1个作为外部验证集(n=26)。训练集中单因素Logistic和t检验筛选与病理学缓解相关基因(未多重校正P<0.05),并按P值排秩。取P<0.05所有基因纳入LASSO算法,取前50个基因纳入SVM算法构建预测模型,并在对应的验证集中验证。反复随机取样500次以判断标签基因和模型的稳定性。取LASSO算法纳入模型次数最多的21个基因作为构建预测模型的候选基因,分别以在174例合并数据集或外部独立验证集中的Logistic回归系数与表达值乘积和作为放化疗敏感指标进行验证。在174例合并数据集中分析NCRT缓解组与未缓解组间差异表达基因和调控网络。结果 GSE35452、GSE46862和GSE68204数据集共12 803个基因纳入分析。LASSO算法在内部验证集中诊断病理学缓解的准确性、特异性和灵敏度分别为0.523(95%CI:0.396~0.642)、0.578(95%CI:0.373~0.762)、0.464(95%CI:0.258~0.700)。SVM法在内部验证集中的诊断准确性、特异性和灵敏度分别为0.504(95%CI:0.377~0.623)、0.596(95%CI:0.393~0.830)、0.405(95%CI:0.182~0.650)。21基因放化疗敏感指标对174例合并数据集和外部独立验证集的病理学缓解诊断的AUC分别为0.863 (95%CI:0.811~0.912)和0.925 (95%CI:0.817~1.000)。结论由于个体间肿瘤异质性的影响,基于特定人群基因表达构建的新辅助放化疗缓解预测模型在不同人群中效能较低。调控网络分析表明参与直肠癌浸润、转移以及干性转化的机制可能介导了直肠癌放化疗抵抗。

全文