摘要
目的 基于梯度提升机(GBM)算法构建弥漫大B细胞淋巴瘤(DLBCL)患者并发间质性肺炎(IP)的预测模型并验证模型效能。方法 回顾性分析220例DLBCL患者的临床数据,将患者按7∶3比例分为训练集154例和测试集66例,其中51例患者发生IP(占23.18%), 169例患者未发生IP。基于GBM算法构建预测模型,采用受试者工作特征(ROC)曲线评估模型的区分度,采用校准曲线评估模型的拟合情况。结果 经过筛选,年龄、疾病分期、国际预后指数(IPI)评分、吸烟史、乳酸脱氢酶(LDH)这5个最优特征被纳入GBM模型,其相对重要性从高到低依次为年龄、疾病分期、LDH、IPI评分、吸烟史。ROC曲线显示,GBM模型在训练集和测试集中的曲线下面积(AUC)分别为0.872(95%CI:0.800~0.945)、0.891(95%CI:0.755~1.000)。校准曲线显示,GBM模型在训练集和测试集中的预测概率均与实际IP发生率具有较好的一致性。结论 DLBCL患者治疗后的IP发生率为23.18%,主要与年龄、疾病分期、IPI评分、吸烟史、LDH水平有关,基于这些因素构建的GBM模型具有较高的准确度和区分度,可为DLBCL患者的临床治疗决策提供参考依据。
- 单位