摘要

目的对山西省某医院2011-2017年确诊为弥漫大B细胞淋巴瘤(diffuse large B-cell lymphoma, DLBCL)患者进行疾病进展阶段多分类预测,为患者是否需要及时转为二线挽救治疗或放疗等治疗手段的选择提供参考。方法用层次分类法将三分类的疾病进展阶段进行两层二分类,分别进行变量筛选后,用SMOTE过采样处理数据中的类别不平衡问题,然后使用SVM、BP神经网络、随机森林等单分类器模型与AdaBoost同型集成和Stacking异型集成方法分别构建两层疾病进展阶段的二分类预测模型,最后分别选择两层中分类性能最优的模型并结合在一起。结果使用经SMOTE平衡后的数据构建的两层分类模型中的SVMboost集成模型,准确率分别为0.951和0.972,模型性能均为最优,因此两层二分类的基分类器均选择SVMboost。结论本研究构建弥漫大B细胞淋巴瘤患者疾病进展阶段的层次多分类预测模型,其中两层分类模型中的SVMboost集成模型性能均为最优,将两层二分类的基分类器结合后,准确率为0.924,高于作为对比的直接多分类模型,为临床工作者的诊断与治疗方案选择提供一定参考。