摘要

目的基于机器学习分析重症监护病房(ICU)脓毒症患者院内死亡的危险因素, 并构建预测模型, 探讨预测模型的预测价值。方法回顾分析2015年4月至2021年4月在济宁医学院附属医院ICU住院治疗的脓毒症患者的临床资料, 包括人口统计学信息、生命体征、合并症、实验室检查指标、诊断和治疗等。根据患者是否发生院内死亡分为死亡组和存活组。随机抽取数据集中70%的病例作为训练集用于模型建立, 其余30%的病例作为验证集。基于逻辑回归(LR)、K-最近邻(KNN)、支持向量机(SVM)、决策树(DT)、随机森林(RF)、极端梯度提升(XGBoost)和人工神经网络(ANN)等7个机器学习模型, 构建脓毒症患者住院病死率预测模型。分别用受试者工作特征曲线(ROC曲线)、校准曲线、决策曲线分析(DCA)从鉴别、校准和临床应用等方面评估7个模型的预测性能。此外, 将基于机器学习的预测模型与序贯器官衰竭评分(SOFA)和急性生理学与慢性健康状况评分Ⅱ(APACHEⅡ)模型进行比较。结果共纳入741例脓毒症患者, 其中好转出院390例, 院内死亡351例, 院内病死率为47.4%。死亡组与存活组间性别、年龄、APACHEⅡ评分、SOFA评分、格拉斯哥昏迷评分(GCS)、心率、氧合指数(PaO2/FiO2)、机械通气比例、机械通气时间、使用去甲肾上腺素(NE)比例、NE最大量、血乳酸(Lac)、活化部分凝血活酶时间(APTT)、白蛋白(ALB)、血肌酐(SCr)、尿素氮(BUN)、血尿酸(BUA)、pH值、碱剩余(BE)、血钾(K+)等差异有统计学意义。ROC曲线分析显示, RF、XGBoost、LR、ANN、DT、SVM、KNN模型和SOFA评分、APACHEⅡ评分预测脓毒症患者住院病死率的曲线下面积(AUC)分别为0.871、0.846、0.751、0.747、0.677、0.657、0.555、0.749和0.760。在所有模型中, RF模型具有最高的精确度(0.750)、准确度(0.785)、召回率(0.773)、F1得分(0.761), 辨别力最佳。校准曲线显示RF模型在7个机器学习模型中表现最佳。DCA曲线分析显示, 与其他模型相比, RF模型表现出更大的净效益以及阈值概率, 表明RF模型是具有良好临床实用性的最佳模型。结论机器学习模型可以作为预测脓毒症患者住院病死率的可靠工具。RF模型具有最佳的预测性能, 有助于临床医生识别高危患者并早期实施干预以降低病死率。

  • 单位
    济宁医学院附属医院