摘要

目的探索SHAP值结合极端梯度提升树(XGBoost)算法的特征选择技术来构建调强放疗γ通过率预测模型的可行性和有效性, 并给出相应的模型解释。方法回顾性分析2020年11月至2021年11月在湖南省肿瘤医院接受盆腔固定野调强放射治疗的196例肿瘤患者采用基于模体测量方式的调强放疗计划的剂量验证结果, γ通过率标准为3%/2 mm、10%剂量阈值。提取基于剂量文件的影像组学特征并使用SHAP值结合XGBoost算法进行特征筛选后构建预测模型。分别选取特征数量为50、80、110、140个, 构建四种机器学习分类模型, 计算曲线下面积(AUC)值、召回率及F1分数评估预测模型的分类性能。结果基于SHAP值特征选择的110个特征构建的预测模型AUC值为0.81, 召回率达到0.93, F1分数为0.82, 均优于其他三个模型。结论针对盆腔肿瘤调强放疗计划, 可以采用SHAP值与XGBoost算法结合以选择用于预测的最佳影像组学特征子集来构建γ通过率的预测模型, 并能通过SHAP值给出模型输出解释, 可能在理解依赖机器学习模型所做的预测方面提供价值。