摘要
目的比较不同机器学习模型利用院前数据对严重创伤患者院内不良结局的预测效能。方法采用回顾性队列研究分析2017年1月至2018年12月美国国家创伤数据库(NTDB)中100 135例严重创伤患者的临床资料, 其中男69 644例, 女30 480例(性别变量缺失11例);年龄16~89岁[(50.1±21.1)岁]。临床特征包括人口学信息(性别、年龄)、创伤类型(钝性伤或穿透伤)、院前时间[急救医疗服务(EMS)反应时间、EMS现场时间和EMS转运时间]、院前生命体征(收缩压、脉率、呼吸频率和血氧饱和度)、创伤评分[格拉斯哥昏迷评分(GCS)、损伤严重度评分(ISS)]。将原始数据按入院年份分为训练集(2017年)和测试集(2018年)。其中训练集50 429例, 测试集49 706例, 按有无发生不良结局将患者分为无不良事件发生组(94 526例)和不良事件发生组(5 609例)。训练集中不良事件组为2 808例, 测试集中不良事件组为2 801例。所有模型均基于训练集构建, 采用神经网络(NNET)、朴素贝叶斯(NB)、梯度提升树(GBM)、自适应增强机(Ada)、随机森林(RF)、袋装树(BT)、分类增强机(CatBoost)和极度梯度提升(XGB)8种机器学习算法根据患者临床特征构建严重创伤患者临床结局的预测模型。根据预测模型的灵敏度、特异度、受试者工作特征(ROC)的曲线下面积(AUC)和Hosmer-Lemeshow拟合优度检验来评价模型预测效能。结果 NNET、NB、GBM、Ada、RF、BT、CatBoost和XGB模型在测试集中的灵敏度分别0.84, 0.83, 0.27, 0.79, 0.83, 0.81, 0.62, 0.78;特异度分别为0.79, 0.76, 0.81, 0.79, 0.79, 0.74, 0.83, 0.79;AUC分别为0.89(95%CI 0.88, 0.90), 0.86(95%CI 0.85, 0.87), 0.54(95%CI 0.53, 0.55), 0.86(95%CI 0.85, 0.87), 0.88(95%CI 0.88, 0.90), 0.83(95%CI 0.82, 0.85), 0.77(95%CI 0.76, 0.79), 0.86(95%CI 0.85, 0.87), 其中NNET模型的区分度最佳。NNET模型和NB模型的校准度也表现出良好的性能, Hosmer-Lemeshow拟合优度检验P值>0.05。结论 NNET模型对严重创伤患者院内不良结局的预测效能较好, 可在一定程度上为快速预测严重创伤患者的预后提供参考。
-
单位中国人民解放军陆军军医大学; 中国人民解放军第二军医大学; 第一附属医院病理科