摘要
目的基于人工智能技术建立肿瘤患者接受高致吐风险铂类药物化疗诱发恶心呕吐(CINV)的风险预测模型, 为止吐方案的选择提供依据。方法收集2018年1月至2022年12月在天津医科大学总医院肿瘤科登记的接受顺铂或卡铂[卡铂血药浓度-时间曲线下面积(AUC)≥4]肿瘤患者的临床信息, 包括性别、年龄、饮酒史、孕吐史、化疗周期、患者对发生恶心呕吐的预期、化疗药物、止吐方案、院外止吐治疗、化疗前夜睡眠小于7 h、上周期发生CINV情况、肌酐清除率(Ccr)等。对数据进行预处理后随机分为训练集和测试集, 训练集用于构建预测模型, 测试集用于评价模型预测效能。分别采用梯度提升树(GBDT)、随机森林(RF)和逻辑回归(LR)3种算法建立预测模型, 并对模型性能进行评价。评价指标包括准确度、灵敏度、召回率、F1值(灵敏度和召回率的调和平均数)和受试者工作特征曲线下面积(AUROC)。最后应用Shapley加法解释(SHAP)方法对有预测意义的临床特征进行可解释性分析。结果本研究共纳入患者698例, 男性439例(62.9%);中位年龄64(21,84)岁;共接受1 654个周期化疗。化疗方案含顺铂者364例, 化疗864个周期;含卡铂且AUC≥4者361例, 化疗790个周期。止吐方案选择神经激肽-1受体拮抗剂(NK-1 RA)、5-羟色胺3受体拮抗剂(5-HT3 RA)和地塞米松者的治疗周期数为1 347个, 选择5-HT3 RA和地塞米松者的周期数为307个。Spearman相关性分析结果显示肿瘤患者特征变量之间相关性不强, 均可用于模型建立。GBDT最优超参数nestimators=500, maxdepth=9;RF最优超参数maxdepth=5;LR最优超参数penalty=L2。根据最优超参数训练数据分别建立GBDT、RF和LR 3种预测模型。GBDT模型准确度为0.903, 灵敏度为0.882, 召回率为0.903, F1值为0.883, AUROC为0.778±0.036(95%CI:0.739~0.814);RF模型的准确度为0.885, 灵敏度为0.861, 召回率为0.885, F1值为0.870, AUROC为0.679±0.041(95%CI:0.636~0.720);LR模型的准确度为0.817, 灵敏度为0.851, 召回率为0.817, F1值为0.832, AUROC为0.682±0.042(95%CI:0.639~0.723)。Ccr、年龄、化疗周期、饮酒史以及化疗前患者预期会发生恶心呕吐是具有预测意义的主要临床特征;Ccr、年龄、化疗周期与CINV的发生呈负相关, 无饮酒史和患者预期会发生恶心呕吐会增加CINV的发生风险。结论 GBDT、RF和LR 3种模型均可对接受高致吐铂类药物患者CINV的发生风险进行预测, 其中GBDT模型的预测效能最佳。
-
单位天津市环湖医院; 天津医科大学总医院