摘要

目的 探讨机器学习模型在预测胸段食管鳞状细胞癌(鳞癌)患者术后生存风险分层中的应用价值。方法 回顾性分析2014年1月—2015年9月在苏北人民医院胸外科行食管癌根治术的369例胸段食管鳞癌患者的临床资料,其中男279例(75.6%)、女90例(24.4%),年龄41~78岁。将患者按7∶3比例随机分为训练集(259例)和测试集(110例)。通过选择最佳特征子集进行变量筛选。在此基础上构建6种机器学习模型,并在独立测试集验证。通过曲线下面积(area under the curve,AUC)、准确率、对数损失函数值评价模型的预测性能,通过校准曲线反映模型的拟合情况。从中选出最佳模型作为最终模型,利用X-tile进行风险分层,采用KaplanMeier法与log-rank检验进行生存分析。结果 胸段食管鳞癌患者术后5年生存率为67.5%。训练集和测试集之间各项临床病理特征差异均无统计学意义(P均>0.05)。最终纳入高血压、吸烟史、饮酒史、组织分化程度、pN分期、脉管侵犯、神经侵犯共7个变量进行建模,各模型在独立测试集中的AUC值分别为:决策树(AUC=0.796)、支持向量机(AUC=0.829)、随机森林(AUC=0.831)、逻辑回归(AUC=0.838)、梯度提升机(AUC=0.846)、XGBoost(AUC=0.853)。最终遴选出XGBoost模型作为最佳模型,并分别对训练集和测试集进行风险分层,其中将训练集和测试集患者分别分为低危组、中危组和高危组。在训练集和测试集中,三组患者手术预后情况差异均有统计学意义(P<0.001)。结论 机器学习模型在预测胸段食管鳞癌术后预后方面具有较高价值,XGBoost模型对胸段食管鳞癌患者术后5年生存情况的预测性能优于常见机器学习方法,具有较高的实用性和可靠性。